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本 书 英文 名 中 的 “Handbook” 一 词 非常 贴切 ”作为 一 本 推荐 系统 的 手册 ， 它 既 不 是 一 本 泛 
谈 推荐 技术 的 入 门 书籍 ， 也 不 是 一 本 纯 理论 的 论文 集 本 书 针对 我 们 在 建设 推荐 系统 中 会 遇 到 的 
实际 问题 ， 结 合理 论 和 应 用 场景 ， 实 践 性 地 进行 了 深入 探讨 “推荐 系统 的 初学 者 可 能 并 不 适合 在 
接 逆 读本 书 的 部 分 章节 ， 本 书 更 适合 作为 推荐 系统 研发 人 员 的 参考 书 ， 在 有 一 定 实 践 经 验 后 ， 结 
合 工作 中 遇 到 的 真实 问题 来 阅读 
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太 书 全 面 介绍 推荐 系统 中 的 数据 处 理 方法 ， 使 读者 可 能 很 容易 理解 推荐 系统 的 原理 、 并 法 和 
实现 无 论 是 对 推荐 系统 的 初学 者 还 是 业界 实践 者 来 说 ， 本 书 部 是 一 个 福音 
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推荐 系统 是 为 用 户 推荐 所 需 物品 的 软件 工具 和 技术 ， 对 于 在 线 处 理 信息 过 载 是 一 个 非常 有 价值 的 
方法 ， 并 成 为 电子 商务 领域 最 强大 和 流行 的 工具 之 一 。 本 书 融合 不 同 领域 专家 学 者 的 理论 成 果 和 实践 
经 验 ， 从 推荐 系统 相关 技术 、 推 荐 系统 的 应 用 与 评估 、 推 荐 系统 的 交互 、 推 荐 系统 和 社区 及 高 级 算法 5 
个 方面 介绍 推荐 系统 的 主要 概念 、 理 论 、 方 法 、 趋 势 、 挑 战 和 应 用 ， 详 细 阐释 如 何 支持 用 户 决 策 、 计 


划 和 购买 过 程 ， 帮 助 你 梳理 推荐 系统 的 相关 知识 体系 ， 并 理解 推荐 系统 的 原理 、 算 法 及 实现 。 
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本 书 汇 聚 不 同 领域 专家 学 者 的 理论 成 果 和 实践 经 验 ， 全 面 介绍 推荐 系统 的 主要 概念 、 理 论 、 趋 势 、 
挑战 和 应 用 ， 详 细 冰 释 如 何 支持 用 户 决策 、 计 划 和 购买 过 程 。 书 中 既 详细 讲解 了 经 典 方法 ， 又 介绍 了 一 
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前 应 用 过 程 中 遇 到 的 问题 与 挑战 。 第 一 部 分 (第 2~7 章 ) 介绍 当前 构建 推荐 系统 最 普遍 使 用 的 技术 ， 如 
协同 过 滤 、 基 于 内 容 的 数据 挖掘 方法 、 上 下 文 相关 的 方法 等 。 第 二 部 分 (第 8~12 Et) 概述 已 用 于 评价 
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更 合适 的 算法 提供 准则 ， 以 及 评估 用 于 开发 推荐 系统 的 方法 、 挑 战 和 评测 指标 。 第 三 部 分 (第 13~17 
章 ) 讨论 推荐 系统 如 何 呈 现 、 浏 览 、 解 释 和 可 视 化 等 若干 问题 ， 这 一 部 分 讨论 的 技术 使 推荐 过 程 更 加 结 
构 化 以 及 具有 可 交互 性 。 第 四 部 分 (第 18~21 Et) 讨论 利用 各 类 用 户 生 成 内 容 ( UGC， 如 标签 、 搜 索 
查询 、 信 任 评价 等 ) 产生 类 型 新 颖 且 更 可 信 的 推荐 结果 。 第 五 部 分 (第 22-25 B) 讨论 推荐 系统 的 高 级 
课题 ， 如 探索 用 主动 学 习 的 原则 来 指导 获取 新 知识 ;防止 推荐 系统 受 恶意 用 户 攻击 的 合适 技术 ; 如 何 整 
合 多 种 类 型 的 用 户 反馈 和 用 户 偏好 信息 来 构造 更 可 靠 的 推荐 系统 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 
的 各 个 领域 取得 了 董 断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 辈出 、 独 领 风 驭 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著 
作 ， 不 仅 壁 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 
其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 l 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ;而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 我 们 就 将 
工作 重点 放 在 了 入选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw- Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 和 良好 
的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum , Bjarne Stroustrup， 
Brain W. Kernighan, Dennis Ritchie, Jim Gray，Afred V. Aho， John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy; 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 为 总 称 出 版 ， 供 读者 学 
习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作 
品 在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 
近 两 百 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 人 参 
考 书籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐 
渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华章 公司 欢迎 老师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 . www. hzbook. com 
电子 邮件 : hzjsj@hzbook. com 


联系 电话 . (010)88379604 = 
联系 地 址 ， 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 


邮政 编码 :100037 华章 科技 图 书 出 版 中 心 
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面 对 互 联网 上 的 海量 信息 ， 普 通用 户 往往 无 所 适 从 。 为 了 满足 用 户 的 信息 需求 ， 计 算 
机 科学 家 发 明了 两 项 意义 深远 的 技术 : 一 是 搜索 技术 ， 它 帮助 计算 机 系统 被 动 地 应 答 用 户 
的 查询 ， 将 与 之 最 相关 、 最 重要 的 信息 返回 给 用 户 ; 二 是 推荐 系统 技术 ， 它 根据 用 户 的 兴 
趣 、 行 为 、 情 景 等 信息 ， 把 用 户 最 可 能 感 兴趣 的 内 容 主动 推送 给 用 户 。 近 年 来 ， 推 荐 系统 
技术 得 到 了 长 足 的 发 展 ， 不 但 成 为 学 术 研 究 的 热点 之 一 ， 而 且 在 电子 商务 、 在 线 广 告 、 社 
交 网 络 等 重要 的 互联 网 应 用 中 大 显 身 手 。 

推荐 系统 是 一 个 相对 而 言 比较 新 的 技术 领域 ,市 面 上 全 面 介 绍 其 相关 技术 的 中 文书 籍 
并 不 多 见 。 我 和 蒋 凡 在 微 博 上 “ 神 交 ”已 入 ， 这 次 听闻 他 在 翻译 整理 《推荐 系统 : 技术 、 评 
估 及 高 效 算 法 》 一 书 ， 非 常 欣慰 ， 也 相信 他 的 译本 可 以 为 对 推荐 系统 感 兴趣 的 广大 读者 带 
来 福音 。 因 此 ， 欣 然 允 诺 写 序 文 一 篇 ， 来 “推荐 ”这 本 书 。 

本 书 是 一 本 结集 ， 由 来 自 不 同 领域 的 资深 研究 人 员 联 合 撰写 ， 其 内 容 涵 盖 了 推荐 系统 
的 各 个 方面 ， 既 有 实战 价值 ， 又 有 理论 深度 ， 是 一 本 受众 面 很 广 的 好 书 。 它 的 英文 版 有 非 
常 好 的 销售 记录 ， 也 被 很 多 学 校 和 公司 作为 参考 书目 。 将 这 样 一 本 书 翻译 成 中 文 有 很 大 的 
价值 ， 同 时 也 有 不 小 的 难度 。 比 如 ， 由 于 本 书 篇 幅 很 长 ， 翻 译 过 程 需 要 付出 巨大 的 时 间 成 
本 ;由 于 本 书 各 章节 的 多 样 性 ， 翻 译 过 程 需 要 很 宽 的 知识 面 ; 由 于 推荐 系统 的 技术 比较 
新 ， 某 些 技术 词汇 的 翻译 尚未 达成 广泛 共识 ; 由 于 本 书 兼 备 技术 和 理论 ， 对 译 者 的 算法 、 
数学 等 方面 都 提出 了 很 高 的 要 求 。 翻 阅 了 茶几 的 翻译 稿 ， 能 够 清晰 地 感受 到 他 在 本 书 的 翻 
译 过 程 中 所 做 的 巨大 努力 。 多 年 来 将 凡 对 推荐 系统 技术 的 深入 研究 ， 以 及 在 互联 网 公司 的 
亲身 实践 ， 能 为 本 书 的 翻译 保驾 护航 。 总 体 而 言 ， 本 书 的 翻译 稿 用 词 准确 、 语 言 流畅 ， 并 
且 在 原 书 交代 不 够 清晰 的 地 方 还 加 入 了 译 者 注解 ， 更 方便 读者 阅读 和 理解 。 相 信 萝 凡人 参与 
翻译 的 这 本 书 会 对 国内 推荐 系统 方面 的 研究 与 实践 产生 积极 的 推动 作用 ， 并 且 成 为 该 技术 
领域 的 重要 中 文 参考 文献 。 


刘 铁 岩 

首席 研究 员 / 主 任 研究 员 
微软 亚洲 研究 院 

2015 年 6 月 
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随 着 互联 网 尤其 是 移动 互联 网 的 兴起 ， 在 海量 的 信息 和 数据 中 挖掘 有 价值 的 信息 呈现 
给 用 户 ， 成 为 电 商 、 社 交 、 新 闻 、 影 音 等 各 大 主流 应 用 的 核心 功能 。 

推荐 系统 正 是 这 样 一 项 技术 ， 它 集 数据 挖掘 、 机 器 学 习 、 用 户 行为 学 、 人 机 交互 等 多 
个 领域 的 知识 为 一 体 ， 结 合 日 渐 普及 的 大 规模 并 行 数据 处 理 框架 ， 为 每 位 用 户 提供 精准 
的 、 及 时 的 乃至 带 有 惊喜 感 的 个 性 化 信息 服务 。 

本 书 以 推荐 系统 领域 的 欧美 知名 学 者 为 主要 发 起 人 ， 结 合 实际 应 用 ， 为 推荐 系统 的 初 
学 者 和 从 业 人 员 提 供 了 一 份 权威 参考 资料 。 

对 在 校 学 生 及 初学 者 而 言 ， 若 时 间 人 允许 ， 建 议 比较 全 面 地 浏览 本 书 主要 章节 ， 边 读 边 
思考 ， 重 在 构建 知识 的 体系 、 深 入 思考 问题 和 解决 问题 的 习惯 。 例 如 深刻 理解 协同 过 滤 中 
Item-based、User-based( 同 好 )、 和 矩阵 分 解 等 算法 各 自 的 特性 ， 独 立 进 行 代码 实现 ， 在 开 
放 的 、 带 有 语义 信息 的 数据 集 上 ， 根 据 多 种 指标 分 析 推 荐 的 结果 并 思考 算法 为 何 会 产生 此 
类 结果 。 通 过 这 个 过 程 ， 将 书本 知识 转化 为 自己 的 体悟 。 

对 推荐 系统 的 从 业者 而 言 ， 本 书 是 一 本 很 好 的 工作 手册 ， 遇 到 问题 时 可 以 随时 翻阅 ， 
但 其 作用 不 仅 限于 此 ， 同 时 帮助 大 家 开拓 思路 、 提 升 系统 性 解决 问题 的 能 力 。 举 例 而 言 ， 
ABA 8 章 提 到 的 推荐 系统 的 若干 评测 指标 ， 如 新 颖 度 、 多 样 性 、 惊 喜 度 、 健 壮 性 等 ， 给 
我 们 启发 恨 多 ， 在 手机 淘宝 首页 和 逛 场 景 推 荐 算法 和 系统 中 均 有 应 用 。 对 健壮 性 的 考虑 ， 可 
以 预防 频频 发 生 的 第 三 方 攻击 ;针对 用 户 惊喜 度 的 设计 及 多 目标 优化 ， 可 以 大 大 提升 产品 
体验 和 用 户 留 存 率 等 核心 指标 。 

某 些 章节 介绍 的 内 容 较 生僻 ， 但 在 某 些 垂直 行业 的 推荐 系统 中 可 能 起 着 关键 作用 。 如 
第 21 章 中 介绍 的 组 推荐 算法 和 策略 是 多 用 户 参 与 的 旅游 活动 、 家 庭 娱 乐 系统 的 关键 ; 第 
20 章 谈 到 的 信任 推荐 问题 是 社交 网 络 、 金 融 服 务 领 域 开 发 推荐 系统 的 核心 要 素 。 

推荐 系统 是 一 个 年 轻 的 领域 ， 相 关 技 术 正 在 莲 勃 发 展 中 ， 学 有 余力 的 朋友 可 以 多 关注 
推荐 和 相关 领域 顶级 会 议 (SIGKDD、ACM RecSys、WWW、WSDM 等 ) 及 国内 外 业界 公 
司 的 最 新 成 果 。 同 时 ， 推 荐 系统 的 创新 应 用 层出不穷 ， 在 移动 终端 、 智 能 机 器 人 、 互 联网 
金融 等 ， 只 要 和 用 户 、 消 费 者 交互 的 地 方 ， 都 可 以 看 到 它 的 身影 。 一 个 更 智能 、 更 懂 你 的 
互联 网 离 不 开 智能 推荐 技术 。 

本 书 是 一 个 开始 ， 祝 大 家 早日 在 推荐 的 知识 海洋 中 自在 邀 游 ， 探 索 未 知 新 世界 。 


#2 
阿里 资深 技术 专家 ， 淘 宝 推荐 负责 人 
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胡 聪 ( 胡 户 主 ): 这 本 书 着 实 是 一 本 厚 书 ， 在 刚 开 始 着 手 翻译 的 时 候 ， 反 复 浏 览 目录 里 
25 章 的 内 容 ， 心 潮 澎 洲 ， 激 动 不 已 ， 希望 放 下 手中 一 切 来 研习 它 。 在 大 数据 浪潮 中 ， 推 
荐 系统 作为 一 个 主要 分 支 ， 逐 渐 被 国内 同行 所 关注 ， 但 一 直 苦于 可 用 资料 不 多 。 想 必 很 多 
刚 入 此 行 的 同学 都 在 问 “ 有 没有 全 套 推荐 系统 学 习 资 源 ”,“ 行 业内 推荐 系统 算法 有 哪些 ”， 
等 等 问题 ， 这 本 书 能 够 带 来 一 份 很 好 的 答案 。 这 本 书 由 概述 到 细节 ， 由 算法 理论 到 行业 应 
用 ， 层 层 剖 析 了 推荐 系统 中 的 技术 细节 和 应 用 方向 ， PT ee) AANE: TH 
信 会 成 为 推荐 系统 爱好 者 和 从 业 人 员 手 中 必 备 的 一 本 工具 书 。 

R3 Netflix 大 赛 有 力 地 推进 了 对 推荐 系统 的 广泛 而 深信 的 研究 ， 促 成 新 的 研究 热点 。 
然而 ， 国 内 当前 还 缺少 比较 完整 的 中 文科 普 图 书 。 因此， 本 书 的 出 现 可 有 效 地 填补 这 一 空 
白 ， 进 一 步 推动 推荐 系统 的 研究 和 应 用 。 综 合 来 看 ， 本 书 既 可 以 作为 推荐 系统 专业 研究 人 员 
的 入 门 书籍 ， 也 适用 于 一 般 应 用 推荐 系统 技术 的 工程 人 员 。 对 推荐 系统 的 热爱 和 研究 是 我 有 
幸 参与 此 书 翻译 工作 的 一 个 重要 原因 ， 也 因此 结识 了 许多 志同道合 的 小 伙伴 。 我 非常 感谢 他 
们 对 我 的 帮助 和 指导 ， 与 他 们 的 讨论 和 交流 让 我 受益 菲 浅 。 同 时 ， 也 要 感谢 艳 民 和 蒋 帆 老 
师 ， 他 们 不 惜 放弃 宝贵 的 休息 时 间 来 审核 和 校对 此 书 ， 严 谨 的 工作 作风 和 态度 令 人 敬佩 。 

TRICOT: 研究 生 期 间 偶然 结缘 推荐 系统 ， 坚 信 推 荐 必 将 成 为 继 搜 索 之 后 解决 数据 过 
载 的 重要 方法 。 有 机 会 参与 本 书 的 翻译 倍 感 荣幸 ， 虽 然 期 间 经 历 实习 、 求 职 、 毕 业 等 系列 事件 ， 
但 是 在 朋友 们 的 支持 和 帮助 下 ， 还 是 坚持 完成 了 自己 负责 的 那 部 分 翻译 工作 。 通 过 对 此 书 的 翻 
译 ， 不 仅仅 提升 了 自己 对 推荐 系统 的 理解 ， 也 增强 了 对 推荐 系统 在 大 数据 时 代 所 起 作用 的 信心 ! 
特别 感谢 李 艳 民 对 本 书 翻译 提供 的 各 种 帮助 ， 以 及 蒋 凡 老师 细致 负责 的 审核 和 校对 工作 ! 由 于 
翻译 水 平和 时 间 限 制 ， 本 书 翻译 工作 难免 存在 不 足 之 处 ， 欢 迎 读者 朋友 批评 指正 ， 谢 谢 ! 

ESM: 这 是 一 本 “特别 ”而 又 “伟大 ”的 书 ,“ 特 别 ” 在 于 ， 它 集合 了 推荐 系统 所 涉及 领 
域 的 所 有 知识 ， 并 将 这 些 知识 有 条 不 亲 地 展示 出 来 ， 成 为 第 一 本 专属 于 推荐 系统 领域 的 
B; 而 “伟大 ”在 于 ， 它 凝结 了 很 多 人 的 智慧 ， 比 如 说 每 一 章 后 面 那 长 长 的 参考 目录 就 体现 
了 这 点 。 这 本 书 对 于 初学 者 来 说 是 一 个 很 好 的 起 点 ， 不 仅 可 以 系统 地 了 解 推荐 系统 的 组 成 
部 分 以 及 怎样 着 手 设计 一 个 推荐 系统 ， 让 初学 者 不 会 觉得 无 从 下 手 ， 另 外 本 书 也 描述 了 推 
荐 系统 所 面临 的 挑战 ， 也 许 能 在 阅读 的 过 程 中 突 发 灵感 ， 找 到 自己 的 研究 方向 。 另 外 ， 非 
常 幸运 能 够 参与 本 书 的 翻译 ， 非 常 感谢 一 起 完成 本 书 翻译 的 朋友 们 ， 也 希望 读者 朋友 对 我 
们 的 工作 提出 宝贵 意见 ， 非 常 感谢 ! 

FRR: 本 书 内 容 和 重要 程度 不 言 而 喻 。 在 长 达 15 个 月 的 翻译 过 程 中 共有 49 位 同学 
参与 翻译 和 审核 ， 期 间 有 晋升 为 爸爸 的 、 有 毕业 参加 工作 的 、 有 结婚 步 和 人 幸福 天 堂 的 ， 也 
有 开始 创业 的 ， 在 这 里 由 衷 感谢 他 们 及 其 家 人 能 参与 和 支持 我 们 的 翻译 。 同 时 特别 感谢 蒋 
凡 老 师 能 帮 有 我 一 起 审阅 。 希 望 本 书 能 给 读者 带 来 帮助 。 读 者 有 疑问 或 建议 可 在 本 书 论坛 
(www. rec-sys. net) 讨 论 。 

蒋 凡 : 相信 翻译 这 本 书 应 该 是 每 个 推荐 系统 爱好 者 的 心愿 ， 它 的 博大 精深 令 人 醉心 不 
已 ， 但 它 的 卷 峡 浩 繁 也 令 人 望而却步 。 很 幸运 能 和 不 计 辛劳 、 只 求学 问 的 小 伙伴 们 一 起 完 
成 这 个 心愿 ， 翻 过 高 山 ， 收 入 眼帘 的 就 是 一 马 平川 的 美景 ; 架 起 云梯 ， 就 能 帮助 更 多 的 小 
伙伴 攻 城 拔 寨 、 无 往 不 利 。 这 本 书 终于 面世 了 ， 我 们 用 专注 和 坚韧 将 它 唤 醒 ， 是 因为 我 们 
预感 它 的 魔力 能 够 召唤 来 更 多 有 志 于 此 的 工程 师 ， 让 技术 的 力量 改变 世界 。 
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推荐 系统 是 为 用 户 推荐 所 需 物品 的 软件 工具 和 技术 。 提 供 的 推荐 旨 在 通过 各 种 决策 过 
程 来 支持 用 户 ， 例 如 ， 买 什么 物品 、 听 什么 歌 或 者 读 什么 新 闻 。 推 荐 系统 对 于 在 线 用 户 处 
理 信息 过 载 是 一 个 非常 有 价值 的 方法 ， 并 成 为 电子 商务 领域 最 强大 和 流行 的 工具 。 因 此 ， 
人 们 提出 了 各 种 各 样 的 推荐 技术 ， 并 在 过 去 的 10 年 中 将 其 中 很 多 方法 成 功 地 运用 在 商务 
领域 。 

推荐 系统 的 发 展 需要 多 学 科 的 支持 ， 涉 及 来 自 各 个 领域 的 专家 知识 ， 如 人 工 智能 、 人 
机 交互 、 信 息 检 索 、 数 据 挖掘 、 数 据 统 计 、 自 适应 用 户 界面 、 决 策 支 持 系统 、 市 场 营 销 或 
消费 者 行为 等 。 本 书 旨 在 基于 这 种 多 样 性 ， 通 过 展示 推荐 系统 的 主要 概念 、 理 论 、 方 法 
论 、 趋 势 、 挑 战 和 应 用 等 连贯 而 又 统一 的 知识 体系 ， 帮 助 读 者 从 差异 之 中 梳理 出 头绪 。 这 
是 第 一 本 全 面 阐述 推荐 系统 的 书 ， 其 中 覆盖 了 主要 技术 的 多 个 方面 。 本 书 中 的 丰富 信息 和 
实践 内 容 为 研究 人 员 、 学 生 和 行业 中 的 实践 者 提供 了 一 个 有 关 推 荐 系统 的 全 面 但 简洁 方便 
的 参考 源 。 本 书 不 仅 详 细 介绍 了 经 典 方法 ， 而 且 介绍 了 最 近 引 进 的 新 方法 及 其 扩展 。 本 书 
由 五 部 分 组 成 : 技术 、 推 荐 系统 的 应 用 和 评估 、 推 荐 系统 的 交互 、 推 荐 系统 和 社区 及 高 级 
算法 。 第 一 部 分 展示 了 如 今 构 建 推荐 系统 的 最 流行 和 最 基础 的 技术 ， 如 协同 过 滤 、 基 于 内 
容 的 过 滤 、 数 据 挖掘 方法 和 基于 情境 感知 的 方法 。 第 二 部 分 首先 介绍 用 来 评估 推荐 质量 的 
研究 技术 和 方法 ; 其 次 说 明了 设计 推荐 系统 的 实际 方面 ， 如 设计 和 实现 的 考虑 ， 选 择 更 合 
适 算法 的 环境 指南 ; 再 次 讨论 了 可 能 影响 设计 的 相关 方面 最 后 探讨 了 应 用 在 已 成 型 系统 
评估 上 的 方法 、 挑 战 和 估量 。 第 三 部 分 包括 了 探讨 一 系列 问题 的 文章 ， 这 些 问 题 包括 推荐 
的 展示 、 浏 览 、 解 释 和 视觉 化 ， 以 及 使 得 推荐 过 程 更 结构 化 和 方便 的 技术 等 。 

第 四 部 分 完全 聚焦 于 一 个 全 新 的 话题 ， 但 该 话题 却 基于 过 滤 推 荐 的 主要 思想 ， 例 如 利 
用 用 户 产 生 的 各 种 类 型 的 内 容 来 构建 具有 新 类 型 并 更 加 可 信 的 推荐 系统 。 

第 五 部 分 搜集 了 一 些 关 于 高 阶 话题 的 文章 ， 例 如 利用 主动 学 习 技术 来 引导 新 知识 的 学 
习 ， 构 建 能 够 抵挡 恶意 用 户 攻击 的 健壮 推荐 系统 的 合适 技术 ， 以 及 结合 多 种 用 户 反 馈 和 偏 
好 来 生成 更 加 可 信和 的 推荐 系统 。 

我 们 要 感谢 所 有 为 本 书 做 出 贡献 的 作者 。 感 谢 所 有 审阅 人 员 提 出 的 慷慨 意见 及 建议 。 
特别 感谢 Susan LagerstromFife 和 Springer 的 成 员 ， 感 谢 他 们 在 写 这 本 书 过 程 中 的 合作 。 
最 后 我 们 希望 这 本 手册 有 助 于 这 一 学 科 的 发 展 ， 为 新 手提 供 一 个 卓有成效 的 学 习 方案 ， 能 
够 激 起 更 多 专业 人 士 有 兴趣 参与 本 书 所 讨论 的 主题 ， 使 这 个 具有 挑战 性 的 领域 能 够 硕果 累 
R, 长足 进展 。 


Francesco Ricci 
Lior Rokach 
Bracha Shapira 
Paul B. Kantor 
2010 年 5 月 
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摘要 ”推荐 系统 (Recommender System，RS) 是 向 用 户 建 议 有 用 物品 的 软件 工具 和 技 
术 。 在 本 章 中 ， 我 们 会 简要 地 介绍 推荐 系统 的 基本 思想 和 概念 。 主 要 目标 是 用 连贯 和 结构 
化 的 方式 描述 这 本 手册 的 章节 内 容 ， 以 此 来 帮助 读者 理解 这 本 手册 提供 的 极其 丰富 和 详细 
的 内 容 。 


1.1 简介 


推荐 系统 (RS) 是 一 种 软件 工具 和 技术 方法 ， 它 可 以 向 用 户 建议 有 用 的 物品 [60，85， 
25]， 这 种 建议 适用 于 多 种 决策 过 程 ， 如 购买 什么 物品 、 听 什么 音乐 、 在 网 上 浏览 什么 新 
闻 等 。 

品 ” 是 用 来 表示 系统 向 用 户 推荐 内 容 的 总 称 。 一 个 推荐 系统 通常 专注 于 一 个 特定 类 
型 的 物品 (如 CD 或 新 闻 )， 因 此 它 的 设计 、 图 形 用 户 界 面 以 及 用 于 生成 建议 的 核心 的 推荐 
技术 都 是 为 特定 类 型 的 物品 提供 有 用 和 有 效 的 建议 而 定制 的 。 

推荐 系统 主要 针对 的 是 那些 缺乏 足够 的 个 人 经 验 和 能 力 的 人 ， 他 们 无 法 评估 潜在 的 大 
量 可 供 选 择 的 物品 ， 比 如 ， 某 个 网 站 提供 的 商品 [85]。 一 个 典型 的 例子 是 图 书 推荐 系统 ， 
它 帮助 用 户 挑选 一 本 书 来 读 。 在 亚马逊 ， 网 站 采用 个 性 化 推荐 系统 为 每 个 客户 进行 推荐 
[47]。 由 于 推荐 通常 是 个 性 化 的 ， 不 同 的 用 户 或 用 户 组 接收 的 建议 是 不 同 的 。 当 然 也 存在 
非 个 性 化 推荐 。 它 们 都 是 非常 简单 的 ， 通 常 出 现在 报纸 或 杂志 上 。 典 型 的 例子 包括 书籍 和 
CD 等 的 top 10 推荐 (最 热 销 的 前 10 名 ) 。 虽 然 在 某 些 情况 下 它们 可 能 是 有 用 和 有 效 的 ， 但 
这 些 类 型 的 非 个 性 化 推荐 通常 不 是 推荐 系统 研究 要 解决 的 问题 。 

个 性 化 推荐 最 简单 的 形式 是 提供 一 个 排 好 序 的 物品 列表 。 通 过 这 个 排序 列表 ， 推 荐 系 
统 试图 根据 用 户 的 偏好 和 其 他 约束 条 件 来 预测 最 合适 的 产品 或 服务 。 为 了 完成 这 样 的 计算 
任务 ， 推 荐 系统 收集 用 户 的 喜好 ， 这 种 喜好 是 显 式 的 ， 如 为 产品 打分 ， 或 通过 解释 用 户 的 
行为 做 出 推断 。 例 如 ， 推 荐 系统 可 能 会 把 访问 某 个 特定 商品 详情 页 的 行为 作为 该 用 户 喜 爱 
这 个 主页 上 的 商品 的 隐 式 信号 。 l 

推荐 系统 的 发 展 源 于 一 个 很 简单 的 现象 ， 人 们 在 做 日 常 工作 和 日 常 决策 时 总 是 依赖 于 
其 他 人 提供 的 建议 [60，70]。 例 如 ， 要 选择 一 本 书 的 时 候 ， 通 常 依靠 朋友 的 推荐 ;雇主 依 
人 靠 推荐 信 做 招聘 的 决定 ， 当 选择 观看 的 影片 时 ， 人 们 倾向 于 阅读 并 且 依 赖 影评 家 写 在 报纸 


Francesco Ricci, Faculty of Computer Science, Free University of Bozen-Bolzano, Italy e-mail: fricci@unibz. it 

Lior Rokach, Department of Information Systems Engineering, Ben-Gurion University of the Negev, Israel 
e-mail; liorrk@bgu. ac. il 

Bracha Shapira, Department of Information Systems Engineering, Ben-Gurion University of the Negev, Israel 
e-mail; bshapira@bgu. ac. il 

翻译 : MUKS-ESK HK: EO, MiG, PR 


2 Ble 概 ik 





上 的 影评 。 
为 了 模拟 这 种 行为 ， 第 一 个 推荐 系统 通过 算法 将 社区 用 户 的 建议 推荐 给 一 个 活跃 用 
户 ， 也 就 是 在 寻找 推荐 的 用 户 。 推 荐 的 物品 是 这 些 相 似 用 户 ( 那 些 品 味 相似 的 用 户 ) 襄 欢 
的 。 这 种 方法 称 为 协同 过 滤 ， 它 的 理论 依据 是 ， 如 果 这 个 活跃 的 用 户 以 前 与 一 些 用 户 有 相 
似 爱 好 ， 那 么 来 自 这 些 相 似 用 户 的 其 他 推荐 应 该 是 相关 的 ， 这 些 推 荐 也 是 此 活跃 用 户 感 兴 
趣 的 。 
随 着 电子 商务 网 站 的 发 展 ， 人 迫切 需要 出 现 一 种 能 过 滤 所 有 可 用 的 替代 品 的 推荐 系统 。 
让 用 户 从 这 样 纷繁 复杂 的 物品 (产品 和 服务 ) 中 作出 最 恰当 的 选择 是 非常 困难 的 。 
互联 网 信息 的 爆炸 式 增 长 和 种 类 的 纷繁 复杂 以 及 新 兴 电 子 商 务 服 务 ( 购 买 产品 、 产 品 
比较 、 拍 卖 等 ) 的 出 现 经 常 压 得 用 户 喘 不 过 气 来 ， 导 致 用 户 无 所 适 从 。 这 种 选择 多 样 性 不 
但 没有 产生 经 济 效益 ， 反 而 降低 了 用 户 满意 度 。 大 家 都 明白 可 选择 是 好 的 ， 但 是 太 多 的 选 
择 就 不 是 很 好 了 。 实 际 上 ， 随 着 选择 对 自由 、 自 治 和 自我 决定 带 来 的 影响 变 得 过 度 ， 我 们 
就 会 因为 选择 而 觉得 自由 是 一 件 痛苦 的 事情 [96] 。 
近年 来 ， 推 荐 系统 被 证 明 是 一 种 解决 信息 过 载 问 题 的 有 效 工具 。 从 根本 上 来 讲 ， 推 荐 系 
统 是 通过 为 用 户 指引 该 用 户 不 熟悉 的 新 物品 来 解决 信息 过 载 现象 的 ， 这 些 新 物品 或 许 与 该 用 
户 当前 的 需求 相关 。 对 于 用 户 每 一 个 清晰 表达 的 请 求 ， 根 据 不 同 的 推荐 方法 和 用 户 所 处 的 环 
境 和 和 需求， 推荐 系统 利用 存储 在 自 定义 数据 库 的 关于 用 户 、 可 用 物品 以 及 先前 交易 的 数据 和 
各 种 类 型 的 其 他 知识 产生 推荐 内 容 。 然 后 用 户 可 以 浏览 推荐 的 内 容 。 用 户 可 能 接受 也 可 能 不 
接受 推荐 ， 也 可 能 马上 或 者 过 一 段 时 间 提 供 隐 式 或 者 显 式 的 反馈 。 所 有 这 些 用 户 的 行为 和 反 
馈 可 以 存储 在 推荐 数据 库 ， 并 且 可 用 于 在 下 一 次 用 户 和 系统 相互 作用 时 产生 新 的 推荐 。 
如 上 所 述 ， 相 比 于 其 他 经 典 的 信息 系统 的 工具 和 技术 (如 数据 库 或 搜索 引擎 ) ， 推 荐 系 
统 的 研究 是 相对 较 新 的 。 在 20 世纪 90 年 代 中 期 ， 推 荐 系统 成 为 一 个 独立 的 研究 领域 [35， 
60，70，7]。 近 年 来 ,下面 的 事实 说 明 人 们 对 推荐 系统 的 兴趣 大 大 增加 : 
。 对 于 一 些 有 很 高 评价 的 网 站 ， 如 Amazon.com, YouTube, Netflix, Yahoo!, 
Tripadvisor, Last. fm 和 IMDb， 推 荐 系统 扮演 了 重要 的 角色 。 此 外 ， 许 多 媒体 公 
司 正 在 开发 和 部 署 推荐 系统 作为 它们 提供 给 用 户 的 服务 的 一 部 分 。 例 如 ，Netflix 
〈 一 家 提供 在 线 电 影 租赁 服务 的 网 站 ) 向 第 一 个 能 够 成 功 地 显著 提高 推荐 系统 性 能 
的 团队 奖励 了 100 万 美元 [54]。 
。 本 领域 有 专门 的 正式 会 议和 相关 的 专题 研讨 会 。 在 这 里 专 指 ACM 推荐 系统 会 议 (Re- 
cSys) ， 该 会 议 成 立 于 2007 年 ， 现 在 是 新 的 推荐 技术 的 研究 和 应 用 的 顶级 年 度 盛 会 。 
此 外 ， 像 数据 库 、 信 息 系统 和 自 适 应 系统 领域 等 更 传统 的 大 会 也 经 常会 包括 以 推荐 
系统 为 主题 的 会 议 。 在 这 些 会 议 中 ,值得 一 提 的 是 ACM SIGIR (Special Interest 
Group on Information Retrieval)、UMAP(User Modeling, Adaptation and Personaliza- 
tion) fll ACM SIGMOD(Special Interest Group on Management Of Data) , 
。 世界 各 地 的 高 等 教育 机 构 在 本 科 生 和 研究 生 的 课程 中 已 经 提供 专门 研究 推荐 系统 
的 课程 ;在 计算 机 科学 会 议 中 关于 推荐 系统 的 专题 报告 也 引起 了 人 们 的 极 大 关注 ; 
最 近 一 本 介绍 推荐 系统 技术 的 书 也 已 经 出 版 [48]。 
。 在 学 术 期 刊 中 ,已 经 有 一 些 特刊 专题 涵盖 推荐 系统 领域 的 研究 和 发 展 。 期 刊 中 包 
括 推荐 系统 专刊 的 有 :《AI Communications》(2008)、《IEEE Intelligent Systems) 
(2007), (International Journal of Electronic Commerce) (2006), (International 
Journal of Computer Science and Applications) (2006), «ACM Transactions on 


Computer-Human Interaction) (2005) 和 《ACM Transactions on Information Sys- 
tems) (2004) , 

本 章 简要 介绍 了 推荐 系统 的 基本 思想 和 概念 。 主 要 目标 并 不 是 对 推荐 系统 给 出 包罗 万 
象 的 综合 介绍 和 概览 ， 而 是 用 一 个 连贯 和 结构 化 的 方式 描述 这 本 手册 的 章节 内 容 ， 以 此 帮 
助 读 者 理解 这 本 手册 提供 的 极其 丰富 和 详细 的 内 容 。 

本 书 分 成 五 部 分 : 推荐 相关 技术 、 推 荐 系统 的 应 用 和 评价 、 推 荐 系统 的 交互 、 推 荐 系 
统 和 社区 、 主 流 算法 。 l 

。 第 一 部 分 介绍 当前 构建 推荐 系统 最 普遍 使 用 的 技术 ， 例 如 ， 协 同 过 滤 、 基 于 内 容 

的 数据 挖掘 的 方法 和 上 下 文 相关 的 方法 。 

。 第 二 部 分 概述 了 已 用 于 评价 推荐 质量 的 技术 和 方法 。 这 一 部 分 还 涉及 推荐 系统 设 
计 与 实践 方面 ; 描述 设计 和 实施 推荐 系统 的 注意 事项 ; 为 选择 更 合适 的 算法 提供 
准则 。 这 部 分 还 考虑 到 可 能 影响 推荐 系统 设计 ( 域 、 设 备 、 用 户 等 ) 的 方面 。 最 后 
是 评估 开发 的 推荐 系统 所 用 的 方法 、 挑 战 和 评测 指标 。 

。 第 三 部 分 包括 一 些 涉 及 推荐 系统 如 何 呈 现 、 浏 览 、 解 释 和 可 视 化 等 若干 问题 的 论 
文 。 这 里 讨论 的 技术 使 推荐 过 程 更 加 结构 化 以 及 具有 可 交互 性 。 

。 第 四 部 分 讨论 的 是 一 个 相当 新 颖 的 话题 ， 利 用 各 类 用 户 生 成 内 容 (UGC， 如 标签 、 

搜索 查询 、 信 任 评价 等 ) 来 产生 类 型 新 颖 且 更 可 信 的 推荐 结果 。 尽 管 这 个 话题 相对 
新 颖 ， 但 它 实质 上 根植 于 基于 协同 推荐 的 核心 理念 。 

。 第 五 部 分 展示 了 关于 几 个 高 级 课题 的 论文 ， 例 如， 探索 如 何 用 主动 学 习 的 原则 来 
指导 新 知识 的 获取 ; 防止 推荐 系统 受 恶 意 用 户 攻 击 的 合适 技术 ; 如何 整合 多 种 类 
型 的 用 户 反馈 以 及 用 户 偏好 信息 来 构造 更 可 靠 的 推荐 系统 。 


1.2 推荐 系统 的 功能 


在 前 面 的 内 容 中 ， 将 推荐 系统 定义 为 软件 工具 和 技术 ， 这 些 工 具 和 技术 用 于 为 用 户 提 
供 物品 建议 信息 ， 而 这 些 推荐 信息 用 户 或 许 会 利用 。 现 在 我 们 要 完善 该 定义 ， 以 此 来 表明 
推荐 系统 可 以 起 到 一 系列 可 能 的 作用 。 首 先 ， 我 们 必须 区 别 推荐 系统 在 服务 提供 商 和 用 户 
这 两 方面 分 别 起 到 的 作用 。 例 如 ， 旅 游 中 间 商 (如 Expedia. com) 或 目的 地 管理 机 构 ( 如 
Visitfinland. com) 通 常会 采用 旅游 推荐 系统 来 增加 营业 额 ， 比 如 ， 销 售 更 多 的 房间 ， 或 者 
增加 目的 地 的 游客 数量 [86]。 然 而 ， 用 户 访问 这 两 个 系统 的 主要 动机 是 在 去 某 个 目的 地 旅 
游 时 ， 找 到 合适 的 酒店 和 有 趣 的 事件 或 景点 。 
事实 上 ， 服 务 提 供 商 采用 这 种 技术 的 原因 是 多 样 的 : 
。 增加 物品 销售 数量 。 这 可 能 是 商用 推荐 系统 最 重要 的 作用 ， 即 与 没有 使 用 任何 一 
种 推荐 系统 相 比 ， 能 卖 出 一 些 额 外 的 物品 。 能 做 到 这 一 点 是 因为 推荐 物品 可 能 适 
合 了 用 户 的 需求 和 愿望 。 或 许 用 户 在 尝试 过 几 个 推荐 后 ， 会 认识 到 这 一 点 。 非 商 
业 应 用 也 有 类 似 的 目标 ， 虽 然 用 户 在 选择 物品 的 时 候 无 须 任何 费用 。 例 如 ， 一 个 
基于 内 容 的 新 闻 推荐 系统 的 目的 是 提高 网 站 上 新 闻 类 物品 的 阅读 量 。 
通常 ， 从 服务 提供 商 的 角度 来 看 ， 引 入 推荐 系统 的 主要 目的 是 提高 转化 率 ， 即 接 
受 推 荐 并 消费 物品 的 用 户 数 量 比 上 仅 浏 览 了 这 些 信息 的 普通 访客 数量 。 


日 ”说 服用 户 接受 推荐 的 问题 ， 会 在 我 们 解释 预测 用 户 对 一 物品 的 兴趣 与 用 户 挑选 推荐 物品 的 可 能 性 之 间 的 差 
异 时 再 次 进行 讨论 。 


4 第 1 章 概 述 


出 售 更 多 种 类 的 物品 。 一 个 推荐 系统 的 另 一 个 主要 功能 是 让 用 户 能 够 选择 物品 。 
如 果 没 有 这 样 精准 的 推荐 系统 ， 用 户 可 能 很 难 找到 自己 要 选择 的 物品 。 例 如 ， 对 
于 像 Netflix 这 样 的 电影 推荐 系统 ， 服 务 提 供 者 感 兴趣 的 是 要 能 租 出 去 清单 里 的 所 
有 DVD， 而 不 仅仅 是 最 热门 的 。 如 果 没 有 推荐 系统 ， 这 就 很 困难 了 。 因 为 服务 提 
供 商 没 法 保证 推销 的 电影 就 一 定 能 适合 特定 用 户 的 口味 。 相 反 地 ， 推 荐 系统 就 能 
向 合适 的 用 户 建议 或 推销 不 那么 热门 的 电影 。 

。 增加 用 户 满意 度 。 一 个 设计 良好 的 推荐 系统 还 可 以 提高 网 站 或 者 应 用 程序 的 用 户 

体验 。 用 户 会 觉得 推荐 结果 既 有 趣 又 相关 ， 而 且 如 果 人 机 交互 设计 得 合理 ， 他 还 
会 乐于 使 用 这 个 系统 。 准 确 有 效 的 推荐 结果 ， 加 上 可 用 的 用 户 接口 ， 这 些 措施 将 
会 增加 用 户 对 系统 的 主观 评价 。 反 过 来 这 将 增加 系统 的 使 用 率 和 推荐 结果 被 接受 
的 可 能 性 。 

。 增加 用 户 忠诚 度 。 用 户 应 该 忠于 一 个 网 站 ， 这 样 当 用 户 访 问 该 网 站 时 ， 该 网 站 能 
够 识别 出 老 客 户 并 把 他 作为 一 个 有 价值 的 访问 者 。 这 是 一 个 推荐 系统 的 固有 特性 ， 
因为 许多 推荐 系统 是 利用 用 户 之 前 与 网 站 的 交互 信息 来 产生 推荐 结果 的 ， 这 些 交 
互信 息 包 括 该 用 户 对 物品 的 评分 记录 等 。 因 此 ， 用 户 与 网 站 的 交互 时 间 越 入， 用 
户 模型 就 变 得 越 精确 ， 即 用 户 偏好 的 系统 表示 越 准确 ;与 此 同时 ， 更 多 的 推荐 能 
有 效 地 匹配 用 户 的 喜好 。 

。 更 好 地 了 解 用 户 需 求 。 推 荐 系统 另 一 个 重要 的 功能 是 用 来 描述 用 户 的 喜好 (这 一 功 
能 能 够 在 许多 其 他 应 用 中 使 用 )， 这 些 喜 好 是 收集 到 的 显 式 反馈 或 者 由 系统 预测 到 
的 ( 隐 性 反馈 ) 。 然 后 ， 为 了 其 他 目的 ， 如 提高 物品 的 库存 管理 或 生产 管理 ， 服 务 
提供 商 可 能 重新 使 用 这 方面 的 知识 。 例 如 ， 在 旅游 领域 ， 目 的 地 管理 机 构 可 以 通 
过 分 析 由 推荐 系统 收集 的 数据 (用 户 的 交易 )， 决 定 为 一 个 特定 区 域 的 新 客户 部 门 
做 宣传 或 为 特定 类 型 的 促销 信息 发 布 广告 。 

我 们 在 上 述 中 提 到 了 电子 服务 提供 商 引 入 推荐 系统 的 几 个 重要 动机 。 但 是 如 果 推 荐 系 
统 能 够 有 效 地 支持 用 户 的 任务 或 目标 ， 他 们 或 许 也 会 考虑 使 用 推荐 系统 。 因 此 推荐 系统 必 
须 平衡 这 两 类 参与 者 的 需求 ， 并 为 两 者 都 提供 有 价值 的 服务 。 

Herlocker 等 [25] 的 一 篇 论文 已 经 成 为 这 一 领域 经 典 的 参考 文献 ， 文 中 定义 了 推荐 系 
统 能 够 实现 的 11 个 常见 的 功能 。 有 些 可 能 通常 被 视 为 与 推荐 系统 相关 的 主要 或 核心 任务 ， 
即 可 能 会 对 用 户 有 用 的 物品 推荐 。 其 他 的 可 能 更 多 地 被 视 为 以 “机 会 主义 ”的 方式 开发 的 。 
事实 上 ， 这 种 任务 的 分 化 与 使 用 搜索 引擎 所 遇 到 的 事情 很 相似 ， 搜 索引 擎 的 主要 功能 是 找 
到 用 户 需 求 信息 的 相关 文件 ， 但 它 也 可 以 用 于 检查 一 个 网 页 的 重要 性 (在 查询 结果 列表 中 
该 页 的 位 置 ) 或 发 现 一 个 词 在 文档 中 的 不 同 用 法 。 

。 发 现 一 些 好 的 物品 : 根据 用 户 对 物品 的 喜欢 程度 (例如 ，1 到 5 星 的 评分 ) 的 预测 结 

果 ， 我 们 可 以 用 列表 榜 单 的 形式 推荐 给 用 户 一 些 物品 。 对 商业 系统 来 说 ， 这 是 推 
荐 系统 的 主要 任务 ( 见 第 9 章 ) 。 有 些 系统 不 显示 具体 的 预测 评分 。 

。 发 现 所 有 好 的 物品 : 推荐 所 有 能 满足 用 户 需求 的 物品 。 在 这 种 情况 下 ， 仅 找到 一 
些 合适 的 物品 是 不 够 的 。 当 相关 物品 的 数量 很 少 或 当 推荐 系统 扮演 关键 角色 时 ， 
推荐 系统 要 格外 精确 。 例 如 ， 推 荐 系统 在 医疗 或 金融 领域 的 应 用 。 在 这 些 情况 下 ， 
除了 仔细 评估 所 有 可 能 性 带 来 的 好 处 ， 用 户 还 可 以 从 推荐 系统 的 物品 排序 或 者 推 
荐 系统 额外 产生 的 解释 (推荐 理由 ) 中 受益 。 

。 产品 注解 : 在 给 定 的 上 下 文 语 境 中 (如 一 个 物品 推荐 列表 )， 我 们 根据 用 户 的 长 期 


偏好 来 确定 这 些 物品 的 重要 性 。 例 如 ， 一 个 电视 推荐 系统 会 标识 在 电子 节目 菜单 
中 出 现 的 哪些 电视 节目 是 值得 观看 的 (第 18 章 提供 了 这 个 任务 的 一 个 有 趣 实例 )。 

。 推荐 系列 产品 : 这 个 思路 是 将 物品 的 序列 作为 一 个 令 用 户 满意 的 整体 进行 推荐 ， 
而 不 是 集中 产生 单一 的 推荐 。 典 型 的 例子 包括 推荐 一 个 电视 节目 系列 ;推荐 一 本 
数据 挖掘 的 书 之 后 ， 还 推荐 一 本 关于 推荐 系统 的 书 ; 或 者 是 一 个 音乐 曲目 的 总 集 
[99], [39]. 

。 搭配 推荐 ， 提 供 一 组 完美 措 配 的 物品 。 例 如 ， 一 个 旅行 计划 可 能 由 某 个 特定 区 域 
的 不 同 景点 、 目 的 地 和 住宿 服务 组 成 。 从 用 户 的 角度 来 看 ， 用 户 可 以 考虑 这 些 不 
同 的 替代 方案 ， 并 选择 一 个 唯一 的 旅游 目的 地 [87]。 

。 AE: 在 这 项 任务 中 ， 用 户 只 是 简单 地 浏览 目录 而 并 不 带 有 强烈 的 购买 意图 。 推 
荐 系统 的 任务 是 帮助 用 户 浏览 一 些 其 在 特定 浏览 时 期 可 能 会 感 兴趣 的 物品 。 自 适 
应 超 媒体 技术 [23] 已 经 支持 该 服务 。 

。 发 现 可 信 的 推荐 系统 : 有 些 用 户 不 信任 推荐 系统 ， 于 是 他 们 抱 着 试 试看 的 态度 去 
尝试 推荐 系统 的 推荐 结果 。 因 此 ， 除 了 那些 仅仅 想 要 获得 推荐 的 用 户 ， 一 些 系统 
还 提供 特定 的 功能 让 用 户 测试 推荐 系统 的 行为 。 

。 完善 用 户 资料 :这 涉及 用 户 向 推荐 系统 提供 自己 偏好 信息 的 能 力 。 为 了 提供 个 性 
化 推荐 ， 这 是 一 个 基本 任务 ， 也 是 绝对 必要 的 。 如 果 系统 不 了 解 活 路 用 户 ( 即 寻求 
推荐 帮助 的 用 户 ) 的 明确 信息 ， 那 系统 只 能 提供 给 该 活路 用 户 与 一 般 用 户 一 样 的 
推荐 。 

。 ARRA: 有些 用 户 可 能 一 点 也 不 在 意 给 出 的 推荐 结果 。 相 反 ， 对 他 们 重要 的 是 ， 
系统 允许 他 们 展示 他 们 的 评分 ， 并 表达 他 们 的 评价 和 观念 。 这 种 行为 产生 的 用 户 
满意 度 仍 会 有 助 于 保持 用 户 和 应 用 程序 的 紧密 关系 (正如 我 们 前 面 讨论 服务 提供 商 
的 动机 中 提 到 的 那样 ) 。 

。 帮助 他 人 : 有 些 用 户 乐于 贡献 信息 ， 如 他 们 对 物品 的 评价 (评分 )， 因 为 他 们 相信 
社区 能 从 他 们 的 贡献 中 获得 益处 。 这 可 能 是 将 这 类 信息 输入 推荐 系统 的 主要 动机 ， 
即使 他 们 不 经 常 使 用 这 个 推荐 系统 。 例 如 ， 汽 车 推荐 系统 中 ， 一 个 已 经 买 了 新 车 
的 用 户 将 评价 信息 输入 推荐 系统 时 ， 他 更 多 考虑 的 是 这 些 信息 对 于 其 他 用 户 有 用 ， 
而 不 是 为 了 下 次 再 买 一 辆 车 。 

。 影响 他 人 : 在 基于 Web 的 推荐 系统 中 ， 某 些 用 户 的 主要 目标 是 对 其 他 购买 特定 产 
品 的 用 户 产生 明显 的 影响 。 实 际 情况 是 ， 有 一 些 恶意 用 户 可 能 利用 系统 仅仅 用 来 
促进 或 抑制 某 些 物品 的 销售 ( 见 第 25 章 ) 。 

正如 这 些 观点 所 表明 的 那样 ， 信 息 系统 中 的 推荐 系统 的 作用 是 有 很 大 区 别 的 。 这 种 多 

样 性 需要 利用 一 系列 不 同 的 知识 源 和 技术 。 在 接 下 来 的 两 节 中 ， 我 们 将 讨论 一 个 推荐 系统 
的 数据 和 推荐 系统 常用 的 核心 技术 。 


1.3 数据 和 知识 资源 


推荐 系统 是 信息 处 理 系统 ， 为 了 实现 推荐 ， 该 系统 会 积极 收集 各 种 数据 。 数 据 主要 是 
关于 推荐 的 物品 和 收 到 这 些 推荐 结果 的 用 户 ， 但 是 由 于 推荐 系统 获得 的 数据 和 知识 来 源 可 
能 区 别 很 大 ， 它 们 最 终 是 否 可 以 被 利用 取决 于 推荐 技术 ( 见 1.4 节 )。 这 种 推荐 技术 将 在 本 
手册 的 不 同 章节 中 有 更 加 清晰 的 阐述 ( 详 见 第 11 章 )。 

通常 ， 有 的 推荐 技术 用 的 知识 (领域 ) 较 少 ， 如 只 用 到 用 户 评分 或 者 对 物品 的 评价 等 一 
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些 简单 且 基 础 的 数据 (第 4、5 章 )。 其 他 的 技术 则 依赖 于 更 多 的 知识 ， 如 利用 用 户 或 物品 
的 本 体 性 描述 (第 3 章 ) ， 或 者 约束 性 条 件 ( 第 6 章 )， 或 者 用 户 的 社交 关系 和 行为 活动 (第 
19 章 ) 。 在 任何 情况 下 ， 推 荐 系统 使 用 的 数据 一 般 指 的 是 三 种 对 象 : 物品 、 用 户 和 事务 ， 
也 就 是 用 户 和 物品 的 关系 。 

物品 。 物 品 是 被 推荐 的 对 象 集 。 物 品 具 有 复杂 性 和 有 价值 或 效用 的 特点 。 如 果 物 品 对 
于 用 户 是 有 用 的 ， 那 么 物品 的 作用 就 是 积极 的 ;否则 如 果 物 品 对 于 用 户 不 适合 ， 那 物品 的 
作用 就 是 消极 的 ， 从 而 导致 用 户 在 选择 时 做 出 错误 决定 。 我 们 注意 到 ， 当 一 个 用 户 需要 获 
得 一 个 物品 时 ， 他 总 会 付出 代价 ， 其 中 包括 搜索 物品 的 认 知 代价 和 最 终 为 物品 支付 的 
费用 。 

例如 ， 一 个 新 闻 推 荐 系统 的 设计 师 必 须 考 虑 新 闻 物 品 的 复杂 性 ， 即 新 闻 的 结构 、 文 本 
表述 和 任何 新 闻 物 品 的 时 变 重要 性 。 但 是 推荐 系统 的 设计 者 必须 意识 到 ， 即 使 用 户 没有 花 
钱 阅 读 新 闻 ， 他 们 还 是 为 搜索 并 阅读 这 些 新 闻 物 品 付 出 了 认 知 上 的 代价 。 如 果 选 择 的 物品 
和 用 户 相关 ， 这 个 代价 就 被 用 户 得 到 有 用 信息 的 收益 覆盖 了 ， 可 一 旦 不 相关 ， 推 荐 物品 对 
用 户 的 净 价 值 就 是 负面 的 在 其 他 领域 ， 如 汽车 或 者 金融 投资 ， 当选 择 最 恰当 的 推荐 方法 
时 ， 物 品 真正 的 货币 成 本 成 为 一 个 考虑 的 重要 因素 。 

复杂 度 低 且 价值 小 的 物品 是 : 新 闻 、 网 页 、 书 籍 、 光 盘 、 电 影 。 复 杂 度 高 且 价 值 大 的 
物品 是 : 数码 相机 、 手 机 、 个 人 电脑 等 。 我 们 通常 认为 最 复杂 的 物品 是 保险 政策 、 金 融 投 
资 、 旅 游 、 工 作 [L72] 。 

根据 其 核心 技术 ， 推 荐 系统 可 以 使 用 物品 集 的 一 系列 属性 和 特征 。 例 如 ， 在 电影 推荐 
系统 中 ， 我 们 可 以 使 用 电影 种 类 (如 喜剧 、 悲 剧 等 ) 信 息 、 导 演 信息 和 演员 信息 来 描述 电 
影 ， 并 用 于 弄 清楚 物品 的 效用 是 如 何 依赖 其 特征 的 。 物 品 集 可 以 用 各 种 信息 和 表述 方法 来 
表示 ， 如 可 以 简约 到 单一 的 ID 码 ， 或 者 丰富 到 为 一 组 属性 ， 甚 至 是 该 领域 本 体 表示 中 的 
一 个 概念 (第 3 章 ) 。 

用 户 。 正 如 前 面 提 到 的 那样 ， 推 荐 系统 的 用 户 可 能 有 非常 不 同 的 目的 和 特点 。 为 了 使 
推荐 结果 和 人 机 交互 个 性 化 ， 推 荐 系统 使 用 用 户 的 一 系列 信息 。 这 种 信息 可 以 用 不 同 的 方 
式 组 织 ， 而 且 同 样 的 是 ， 选 择 哪 种 信息 建 模 取决 于 推荐 技术 。 

例如 ， 在 协同 过 滤 中 ， 所 有 用 户 被 建 模 为 一 个 简单 的 列表 ， 该 列表 包含 每 个 用 户 对 车 
干 个 物品 的 评分 记录 。 在 基于 人 口 统计 学 的 推荐 系统 中 ， 会 用 到 如 年 龄 、 性 别 、 职 业 和 受 
教育 程度 等 社会 统计 学 特征 。 用 户 数据 用 来 构成 用 户 模型 [21，32]。 用 户 模型 简明 扼要 地 
描述 了 用 户 的 特征 ， 即 对 用 户 偏好 和 需求 进行 编码 。 不 同 的 建 模 方法 已 经 在 推荐 系统 中 得 
到 应 用 ， 在 一 定 意义 上 ， 推 荐 系统 可 以 被 看 作 一 个 构建 并 使 用 用 户 模型 来 产生 推荐 的 工具 
[19，20]。 如 果 没 有 一 个 实用 的 用 户 模 型 ， 个 性 化 推荐 是 不 可 能 的 (除非 推荐 系统 本 身 就 
是 像 top10 那样 是 非 个 性 化 的 )， 因 此 用 户 模型 起 到 非常 重要 的 作用 。 例 如 ， 再 次 考虑 协 
同 过 滤 方 法 ， 要 么 用 户 被 直接 描述 为 他 对 物品 的 评价 记录 ， 要 么 系统 根据 该 用 户 的 评分 记 
` 录 构 建 一 个 因子 向 量 ， 不 同 用 户 之 间 的 区 别 是 这 些 因 子 权重 在 他 们 模型 中 的 差别 (第 4、5 
章 ) 。 

用 户 也 可 以 通过 他 们 的 行为 模式 数据 来 描述 ， 如 网 站 浏览 模式 (在 基于 Web 的 推荐 系 
统 中 )[1074 或 旅游 搜索 模式 (在 旅游 推荐 系统 中 )[60]。 此 外 ， 用 户 数据 包括 用 户 间 的 关 
系 ， 如 用 户 间 的 信任 级 别 (第 20 章 )。 推 荐 系统 能 利用 这 些 信息 给 用 户 推荐 物品 集 ， 而 这 
些 物 品 集 也 是 相似 用 户 或 可 信任 用 户 所 喜欢 的 。 

事务 (transaction) 。 我 们 一 般 将 一 个 事务 看 作用 户 和 推荐 系统 进行 交互 的 一 条 记录 。 


人 机 交互 过 程 中 产生 的 这 种 类 似 日 志 的 数据 存储 着 重要 的 信息 ， 并 且 这 些 数据 对 系统 中 推 
荐 生成 算法 是 有 用 的 。 比 如 ， 事 务 日 志 可 能 会 涉及 用 户 选择 物品 ， 以 及 特定 推荐 所 处 上 下 
文 描述 信息 (如 用 户 的 目的 和 查询 词 )。 如 果 可 能 ， 事 务 也 会 包括 用 户 提供 的 显 式 反馈 ， 如 
对 选择 物品 的 评分 。 
实际 上 ， 评 分 是 推荐 系统 收集 交易 数据 最 流行 的 方式 。 这 些 评 分 可 能 是 用 显 式 或 者 隐 
式 的 方式 收集 的 。 收 集 显 式 评 分 时 ， 用 户 需 要 在 某 个 评级 尺度 内 给 出 自己 对 物品 的 看 法 。 
oe 评级 可 以 采用 各 种 方式 : 
数字 评分 ， 就 像 Amazon. com 的 书籍 推荐 系统 中 的 1 到 5 星 的 评价 。 
。 序数 评价 ， 例 如 ,“ 强 烈 同 意 ， 同 意 ， 一 般 ， 不 同意 ， 强 烈 反 对 ”， 用 户 在 其 中 选 
择 最 能 代表 自己 观点 的 术语 (一 般 是 通过 问卷 调查 ) 。 
。 二 元 制 评 价 ， 用 户 仅 仅 被 要 求 确 定 一 个 物品 的 好 或 者 不 好 。 
。 一 元 制 评价 ， 用 来 表示 用 户 已 经 看 到 或 者 买 了 一 个 物品 ， 或 由 此 对 物品 进行 明确 
的 评价 。 在 这 种 情况 下 ， 评 分 值 的 缺失 意味 着 关联 用 户 和 物品 的 信息 是 未 知 的 (也 
许 用 户 在 其 他 地 方 买 了 这 个 物品 ) 。 

另 一 种 评价 的 形式 就 是 关联 用 户 和 物品 的 标签 。 例 如 ， 在 Movielens 推荐 系统 
(http; // movielens. umn. edu) 中 ， 标 签 表 示 Movielens 用 户 对 电影 的 感觉 ， 例 如 ,“ 太 长 ” 
或 “表演 不 错 ”。 第 19 章 侧 重 讲解 这 类 交互 行为 。 

从 事务 中 隐 式 收集 用 户 评级 ， 系 统 的 目标 是 根据 用 户 的 行为 推断 用 户 的 意图 。 例 如 ， 
如 果 用 户 在 亚 马 沙 网 站 输入 “瑜伽 ”进行 搜索 ， 那 么 她 将 得 到 关于 书 的 一 个 很 长 的 列表 。 作 
为 回报 ， 用 户 为 了 获得 额外 信息 会 单 击 列表 中 的 书 。 从 这 点 上 看 ， 系 统 可 以 推断 用 户 对 那 
本 书 有 一 定 的 兴趣 了 。 

在 会 话 (conversational) 系 统 中 ， 即 支持 交互 过 程 的 系统 中 ， 交 易 模 型 更 加 精确 。 在 这 
些 系 统 中 ， 用 户 请 求 和 系统 行为 交替 出 现 ( 见 第 13 章 ) 。 更 准确 地 说 ， 用 户 请 求 一 个 推荐 ， 
系统 就 产生 一 个 推荐 列表 。 但 是 系统 仍然 需要 额外 的 用 户 偏 好 信息 ， 以 期 产生 更 好 的 结 
果 。 在 这 个 交易 模型 中 ， 系 统 收集 各 种 请 求 一 响应 信息 ， 并 且 最 终 通 过 观察 推荐 过 程 的 结 
果 来 修改 系统 的 交互 策略 L60j。 


1.4 推荐 技术 


为 了 实现 其 核心 功能 ， 即 识别 对 用 户 有 用 的 物品 ， 推 荐 系统 必须 预测 出 有 推荐 价值 的 
物品 。 为 了 实现 上 述 目 的 ， 系 统 必 须 能 预测 一 些 物品 的 效用 性 (the utility of some of 
them) ， 或 者 至 少 对 物品 的 效用 性 作对 比 ， 然 后 根据 比较 决定 该 推荐 的 物品 。 虽 然 推 荐 算 
法 中 对 预测 这 一 步 描述 不 是 很 明确 ， 但 是 我 们 仍然 可 以 使 用 统一 的 模型 来 描述 推荐 系统 的 
一 般 作 用 。 我 们 的 目的 是 提供 给 读者 一 个 统一 的 思路 ， 而 不 是 所 有 不 同 推荐 方法 的 总 和 ， 
这 些 方法 会 在 本 书 中 逐步 讲解 。 

为 了 说 明 推荐 系统 中 的 预测 这 一 步 ， 我 们 考虑 一 个 简单 的 非 个 性 化 的 推荐 算法 ， 该 算 
法 仅 推荐 最 流行 的 歌曲 。 这 个 方法 的 理论 依据 就 是 在 不 知道 用 户 偏 好 这 样 更 精确 的 信息 的 
情况 下 ， 有 理由 认为 一 首 流行 度 高 的 歌曲 会 被 很 多 用 户 喜 欢 ， 所 以 很 可 能 也 被 一 个 普通 用 
户 喜 欢 ， 因 此 选择 一 do 因此 ， 这 些 流 
行 度 高 的 音乐 的 有 效 性 对 于 普通 用 户 理所当然 就 要 高 。 

文献 [3] 中 提 到 把 核心 推荐 计算 过 程 当 作 预 测 某 件 物品 对 某 个 用 户 的 效用 的 观点 ， 他 
们 把 用 户 对 物品 i 的 可 用 度 建 模 为 实数 值 函数 RC(u，i)， 在 协同 过 滤 中 通常 指 的 是 用 户 





对 物品 的 评分 。 然 后 协同 过 滤 推 荐 系统 的 主要 任务 是 通过 用 户 与 物品 对 来 预测 R 的 值 ， 即 
计算 让 (u，i) ， 这 里 把 让 作为 估计 值 ， 并 由 此 得 到 真实 函数 R 的 值 。 接 下 来 ， 在 物品 集 上 
算出 活路 用户 的 预测 值 也 就 是 尺 (u，ii)，…， 尺 (wu，in) 之 后 ， 系 统 将 会 选择 最 大 效用 的 
物品 i ，…，ijx (KN) 作 为 推荐 结果 。K 通常 是 个 小 的 数字 ， 要 远 小 于 物品 集 的 基数 ， 
或 者 说 是 用 户 效 用 预测 计算 所 依赖 的 物品 的 基数 ， 即 推荐 系统 过滤” 出 推荐 给 用 户 的 
物品 。 

正如 前 面 所 说 ， 一 些 推荐 系统 在 做 出 推荐 之 前 不 是 计算 全 部 效用 ， 但 是 它们 可 以 应 用 
很 多 启发 式 的 方法 猜测 一 个 物品 对 用 户 是 否 有 用 。 典 型 的 案例 是 专家 系统 。 这 些 效用 预测 
是 通过 特殊 算法 (如 下 ?计算 的 ， 并 使 用 了 各 种 各 样 的 关于 知识 、 用 户 、 物 品 和 效用 函数 本 
身 的 知识 ( 见 1. 3 节 )[25]。 例 如 ， 系 统 假定 效用 函数 是 布尔 型 的 ， 只 需要 确定 一 个 物品 是 
否 对 用 户 有 用 。 因 此 ， 对 于 一 个 请 求 推荐 的 用 户 ， 如 果 系 统 能 够 能 获得 该 用 户 的 一 些 知 识 
(有 可 能 得 不 到 ) ， 如 物品 信息 以 及 曾经 接收 到 推荐 结果 的 其 他 用 户 的 知识 ， 系 统 就 能 使 用 . 
恰当 的 算法 利用 这 些 信 息 产生 各 种 效用 预测 并 且 据 此 产生 推荐 [25j]。 

我 们 有 必要 注意 ， 有 些 时 候 物 品 对 用 户 的 效用 是 依赖 于 其 他 可 变 因素 的 ， 我们 把 这 些 
可 变 因 素 统称 为 “ 语 境 ”[1]。 例 如 ， 物 品 对 用 户 的 效用 会 被 用 户 的 领域 信息 所 影响 (例如 ， 
使 用 数码 相机 的 高 手 与 新 手 )， 或 者 随 着 推荐 请 求 发 生 的 时 间 而 变化 。 或 者 用 户 可 能 对 离 
他 当前 位 置 近 的 物品 (如 一 家 饭店 ) 更 感 兴趣 。 因 此 ， 推 荐 结果 必须 与 这 些 特 殊 的 附加 信息 
相 适 应 。 但 是 这 样 做 的 结果 是 ， 准 确 地 计算 出 正确 的 推荐 越 来 越 困难 。 

本 书 介绍 了 许多 不 同 种 类 的 推荐 系统 ， 这 些 推荐 系统 根据 使 用 的 信息 和 用 户 领域 知识 
的 不 同 而 变化 ， 但 正如 一 开始 所 说 那样 还 是 主要 随 着 推荐 算法 而 变化 ， 即 如 何 预 测 推 荐 内 
容 的 效用 。 其 他 的 不 同 是 推荐 系统 最 终 如 何 组 合 推 荐 结果 并 如 何 把 它 展示 给 用 户 用 以 响应 
用 户 的 请 求 。 这 些 方 面 在 导言 的 后 面 也 会 讨论 。 

为 了 提供 不 同类 型 推荐 系统 的 综述 ， 我 们 引用 [25] 提 出 的 分 类 法 ， 此 分 类 方法 是 区 分 
推荐 系统 的 一 种 经 典 的 方法 。 文 献 [25] 为 六 种 不 同 的 推荐 方法 做 了 划分 : 

基于 内 容 (content-based) : 系统 为 用 户 推荐 与 他 们 过 去 的 兴趣 类 似 的 物品 。 物 品 间 的 
相似 性 是 基于 被 比较 的 物品 的 特征 来 计算 的 。 例 如 ， 如 果 某 个 用 户 对 一 部 喜剧 电影 有 了 正 
面 的 评价 ， 那 么 系统 就 能 学 会 从 喜剧 类 型 中 (为 该 用 户 ) 推 荐 其 他 电影 。 第 3 章 给 出 了 基于 
内 容 的 推荐 系统 的 综述 ， 梳 理 出 了 在 涉及 系统 设计 和 实现 时 广泛 性 和 多 样 性 方面 的 关系 ， 
除 此 之 外 ， 还 介绍 了 基于 内 容 推 荐 的 基本 概念 、 专 业 术 语 、 高 层次 的 体系 结构 以 及 主要 的 
优点 和 缺点 。 接 下 来 对 在 几 个 应 用 领域 内 使 用 的 最 先进 系统 做 了 概述 。 报 告 还 包括 了 在 如 
何 表示 物品 和 用 户 信 息 方 面 的 经 典 方法 和 最 新 技术 的 全 面 描述 。 最 后 讨论 了 推荐 系统 的 趋 
势 和 引领 下 一 代 推 荐 系统 的 未 来 研究 。 

T fe] 3t a (collaborative filtering): 这 种 方法 是 找到 与 用 户 有 相同 品味 的 用 户 ， 然 后 将 
相似 用 户 过 去 喜欢 的 物品 推荐 给 用 户 ，[93] 是 对 这 种 方法 有 最 简单 和 最 原始 的 实现 。 两 用 
户 间 的 相似 偏好 是 通过 计算 用 户 历史 评 分 记录 相似 度 得 到 的 。 这 也 是 [94] 将 协同 过 滤 比 作 
“人 对 人 的 相互 关系 ?的 原因 。 协 同 过 滤 被 认为 是 推荐 系统 最 流行 和 最 广泛 实现 的 技术 。 

第 4 章 介绍 了 基于 邻 域 的 协同 过 滤 方 法 。 这 种 方法 关注 物品 之 间 的 关系 或 者 用 户 之 间 
的 关系 。 基 于 物品 的 方法 依据 同一 用 户 对 与 某 个 物品 的 相似 物品 集 的 评分 ， 对 用 户 对 该 物 
品 的 偏好 建 模 。 基 于 邻 域 的 方法 享有 相当 的 知名 度 ， 因 为 它们 简单 、 高 效 以 及 具有 产生 精 
确 计算 和 个 性 化 推荐 的 能 力 。 作 者 将 会 说 明 实 现 基于 邻居 推荐 系统 所 必需 的 结论 ， 并 且 提 
供 了 得 到 这 些 结论 所 需 的 信息 。 


最 后 ， 第 4 章 还 涉及 了 数据 稀疏 和 覆盖 率 有 限 的 问题 ， 而 这 些 问题 经 常 出 现在 大 型 电 
子 商 务 推荐 系统 中 。 本 章 提出 了 这 些 问题 的 一 些 解决 方法 。 

第 5 章 介 绍 了 构建 协同 过 滤 推 荐 系统 的 最 新 进展 。 作 者 特别 介绍 了 隐语 义 模型 
(LFM), ， 例 如 ， 和 矩阵 因子 分 解 ( 如 奇异 值 分 解 、SVD) 。 这 些 方法 把 用 户 集 和 物品 集 映 射 到 
同一 个 隐语 义 空间 。 这 样 就 可 以 通过 因子 同时 表示 产品 和 用 户 ， 利 用 隐语 义 空间 解释 根据 
用 户 反馈 自动 推断 出 的 评分 。 作 者 解释 了 SVD 如 何 处 理 这 些 数据 的 额外 特征 ， 包 括 隐 式 
反馈 和 时 间 信 息 。 还 描述 了 克服 基于 邻 域 的 技术 存在 的 缺点 的 技术 ， 为 此 他 们 建议 使 用 包 
含 了 全 局 优化 技术 的 更 加 严格 的 数学 公式 。 利 用 这 些 技术 我 们 就 能 够 放宽 邻 域 大 小 的 限 
制 ， 同 时 又 能 把 隐 性 反馈 和 动态 时 序 信 息 增加 到 模型 中 。 预 测 结果 的 准确 性 与 矩阵 因子 分 
解 模型 的 准确 性 很 接近 ， 同 时 又 提供 了 一 些 实用 的 优势 。 

基于 人 口 统计 学 的 (demographic): 这 种 类 型 的 推荐 系统 推荐 物品 时 是 基于 人 口 统计 
信息 的 。 我 们 假设 不 同 的 人 群 信息 应 该 产生 不 同 的 推荐 。 许 多 网 站 采用 基于 人 口 统计 学 的 
简单 而 有 效 的 个 性 化 解决 方案 。 例 如 ， 根 据 用 户 的 语言 或 者 国籍 ， 划 分 到 特定 的 网 站 。 或 
者 根据 用 户 的 年 龄 定制 推荐 。 虽 然 这 种 方法 在 营销 的 文献 中 相当 流行 ， 但 是 推荐 系统 方面 
对 此 一 直 很 少 研究 [59]。 

基于 知识 (knowledge-based) : 基于 知识 的 系统 根据 特定 的 领域 知识 推荐 物品 ， 这 些 
知识 是 关于 如 何 确定 物品 的 哪些 特征 能 够 满足 用 户 需要 和 偏好 ， 以 及 最 终 如 何 确定 物品 对 
用 户 有 用 。 著 名 的 基于 知识 的 推荐 系统 是 基于 案例 的 [22，87]。 在 这 些 系 统 中 ， 相 似 函 数 
用 来 估算 用 户 需求 (问题 描述 ) 与 推荐 (解决 问题 ) 的 匹配 度 。 这 里 的 相似 性 得 分 ， 可 以 理解 
为 用 户 推 荐 的 可 用 性 。 

基于 约束 的 系统 是 另 一 种 基于 知识 的 推荐 系统 (第 6 章 )。 从 使 用 的 知识 (knowledge) 
方面 来 说 ， 这 两 个 系统 是 相似 的 : 收集 用 户 需 求 ; 当 找 不 到 解决 方法 的 时 候 系统 自动 提供 
不 合理 需求 的 修改 方案 ; 并 且 能 对 推荐 做 出 解释 。 这 两 者 主要 的 不 同 在 于 解决 方案 的 计算 
方法 。 基 于 案例 的 推荐 是 基于 相似 的 方法 ， 然 而 ， 基 于 约束 的 推荐 系统 主要 是 利用 预定 义 
的 知识 库 ， 这 些 库 包括 了 如 何 把 消费 者 需求 和 物品 特征 相关 联 的 明确 规则 。 

在 刚 开始 部 署 的 时 候 ， 基 于 知识 的 系统 往往 比 其 他 方法 工作 得 更 好 。 但 是 如 果 它 们 没 
有 配备 自动 学 习 组 件 ， 那 么 其 他 利用 用 户 日 志 或 人 机 交互 (如 在 协同 过 滤 中 的 交互 ) 信 息 这 
样 浅显 方法 的 系统 就 可 能 超越 它 。 l 

Æ F 4t (community-based): 这 种 推荐 方法 依赖 用 户 朋 友 的 偏好 。 这 种 技术 有 个 业 
界 流行 的 表述 “告诉 我 你 的 朋友 是 谁 ， 我 将 知道 你 是 谁 "[8，14]。 有 证 据 表 明 ， 人 们 往往 
都 会 更 依赖 朋友 的 建议 而 不 是 陌生 人 的 建议 [103]。 这 个 现象 的 出 现 ， 加 上 日 益 普及 的 社 
交 网 络 ， 于 是 基于 社区 的 推荐 系统 就 应 运 而 生 ， 并 且 得 到 人 们 越 来 越 多 的 关注 。 这 种 系统 
通常 叫 作 社 会 化 推荐 系统 [34] 。 这 种 推荐 系统 获取 用 户 的 社会 关系 和 用 户 朋友 的 偏好 等 信 
息 并 以 此 进行 建 模 。 推 荐 结果 基于 用 户 朋 友 提 供 的 评分 。 实 际 上 ， 这 类 推荐 系统 是 随 着 社 
交 网 络 产生 的 ， 可 以 简单 而 又 全 面 地 采集 与 用 户 社交 关系 相关 的 数据 。 

在 这 个 方面 的 研究 还 处 于 起 始 阶段 ， 并 且 关 于 系统 性 能 的 定论 还 很 混乱 。 例 如 ，[34， 
64] 对 社交 网 络 推荐 系统 做 了 全 面 的 报告 。 报 告 显 示 ， 一 般 情 况 下 ， 这 类 系统 的 准确 性 没 
有 传统 的 协同 过 滤 方 法 高 ， 除 非 是 用 户 对 一 个 特殊 物品 的 评价 变化 特别 大 ( 即 有 争议 的 物 
品 ) 或 者 冷 启动 等 特殊 的 情况 。 在 这 种 情况 下 ， 用 户 不 能 提供 足够 多 的 评分 去 计算 与 其 他 
用 户 的 相似 度 。 其 他 研究 人 员 表 明 ， 在 某 些 情况 下 ， 利 用 社交 网 络 的 数据 产生 的 推荐 结果 
比 使 用 用 户 资料 相似 度数 据 产 生 的 推荐 结果 更 加 准确 [37]， 并 且 把 社交 网 络 数据 增加 到 传 
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统 的 协同 过 滤 算 法 中 能 够 提高 推荐 结果 的 准确 性 [36]j。 第 20 章 概述 了 该 领域 的 研究 成 果 ， 
并 对 当前 结论 进行 了 分 析 。 

混合 推荐 系统 (hybrid recommender system): 这 类 推荐 系统 综合 了 上 面 提 到 的 技术 。 
混合 推荐 就 是 综合 A 和 B 方 法 ， 利 用 A 的 优势 弥补 B 的 不 足 。 例如， 协同 过 滤 方 法 遭遇 
的 新 物品 冷 启 动 问题 ， 也 就 是 不 能 推荐 尚未 被 评分 的 物品 。 而 基于 内 容 的 方法 没有 这 个 限 
制 ， 因 为 新 物品 的 预测 是 基于 物品 描述 (特征 )， 而 这 些 特征 都 是 容易 获得 的 。 给 出 两 个 
(或 多 个 ) 基 本 的 推荐 技术 ,采用 一 些 方 法 将 这 些 技术 综合 起 来 产生 一 个 混合 的 系统 (文献 
[25] 有 详细 描述 ) 。 

我 们 说 过 ， 当 用 户 需 要 推荐 的 时 候 ， 基 于 上 下 文 的 方法 能 使 系统 推荐 更 加 个 性 化 。 例 
如 ， 考 虑 时 间 上 下 文 这 个 因素 时 ， 冬 天 和 夏天 的 假期 推荐 应 该 有 很 大 的 区 别 。 或 者 如 饭店 
推荐 系统 ， 工 作 日 和 同事 一 起 吃饭 的 推荐 应 该 和 周 六 晚上 与 朋友 吃饭 的 推荐 有 很 大 区 别 。 

第 7 章 介 绍 了 上 下 文 的 一 般 概 念 ， 还 介绍 了 推荐 系统 是 如 何 对 它 建 模 的 。 此 外 ， 作 者 
还 提供 了 一 个 案例 用 于 研究 如 何 使 几 种 上 下 文敏 感 的 推荐 技术 整合 为 一 个 单一 算法 的 可 
能 性 。 

在 这 里 讨论 了 把 上 下 文 信息 整合 到 推荐 过 程 的 三 个 不 同 的 算法 范式 : 化 简 ( 预 过 滤 )、 
上 下 文 的 后 过 滤 以 及 上 下 文 建 模 。 在 基于 化 简 ( 预 过 滤 ) 方 法 中 ， 仅 当 信 息 与 当前 使 用 的 上 
下 文 相 匹配 时 (如 在 同一 上 下 文 的 物品 评分 ) 才 能 用 于 计算 推荐 结果 。 在 上 下 文 后 处 理 方法 
中 ， 推 荐 算法 会 忽略 上 下 文 信息 。 该 方法 的 推荐 结果 被 会 过 滤 或 调整 ， 以 便 只 包含 与 目标 
上 下 文 相 关 的 推荐 结果 。 上 下 文 建 模 方法 是 三 种 方法 中 最 复杂 的 方法 。 在 该 方法 中 ， 上 下 
文 信息 在 预测 模型 中 被 显 式 地 使 用 。 


1.5 应 用 与 评价 


推荐 系统 的 研究 着 重 放 在 实践 和 商业 应 用 上 。 因 为 除了 理论 方面 的 贡献 ， 这 方面 的 研 
究 一 般 旨 在 切实 促进 商业 推荐 系统 的 发 展 。 因 此 ， 推 荐 系统 的 研究 包括 实现 这 些 系统 的 实 
践 方面 。 这 些 方面 与 推荐 系统 生命 周期 的 不 同 阶段 都 相关 ， 即 系统 设计 、 实 现 以 及 系统 运 
行 过 程 中 的 维护 和 改善 。 

系统 设计 阶段 所 需 考虑 的 影响 因素 或 许 会 影响 算法 的 选择 。 第 一 个 要 考虑 的 因素 一 一 
应 用 的 领域 是 算法 选择 的 主要 影响 因素 。[72] 提 供 了 推荐 系统 的 分 类 ， 并 且 对 特定 应 用 领 
域 的 推荐 系统 应 用 做 了 分 类 。 基 于 这 些 特定 的 应 用 领域 ， 我 们 为 最 普遍 的 推荐 系统 应 用 做 
了 更 一 般 的 领域 分 类 : 

。 娱乐 : 电影 、 音 乐 和 IPTV 的 推荐 。 

。 内 容 : 个 性 化 新 闻 报 纸 、 文 件 推荐 、 网 页 推荐 、 电 子 学 习 程 序 和 电子 邮件 过 滤 。 

。 电子 商务 : 为 消费 者 推荐 要 购买 的 产品 ， 如 书籍 、 照 相机 、 电 脑 等 。 

。 服务 : 旅游 服务 推荐 、 专 家 咨询 推荐 、 租 房 推荐 或 者 中 介 服 务 。 

随 着 推荐 系统 的 流行 ， 一 些 新 应 用 上 的 潜在 优势 激发 了 人 们 的 兴趣 。 例 如 ， 可 以 像 在 
www. tweeter. com 网 站 那样 推荐 一 个 朋友 列表 或 者 一 个 推 特 信息 列表 。 因 此 ， 诸 如 上 面 
的 列表 并 不 能 覆盖 推荐 技术 所 涉及 的 所 有 应 用 领域 ,这些 列表 只 是 给 出 了 不 同类 型 的 应 用 
领域 的 初始 描述 。 

特定 应 用 领域 的 推荐 系统 开发 商 应 该 了 解 该 领域 的 特殊 方面 、 具 体 的 要 求 、 应 用 程序 
面临 的 挑战 和 局 限 性 。 只 有 在 分 析 这 些 因素 之 后 ， 才 能 选择 最 佳 推荐 算法 ， 并 且 设 计 更 高 
效 的 人 机 交互 。 
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本 书 第 11 章 提供 了 推荐 技术 与 应 用 领域 相 匹配 的 指南 。Burke 和 Ramezani 写 的 章节 
中 为 推荐 系统 提供 了 一 个 新 的 分 类 。 与 以 往 推 荐 系统 分 类 方法 (如 [25，94，3，7]) 不 同 ， 
Burke 和 Ramezani 采用 以 人 工 智能 为 核心 的 方法 ， 而 且 重 点 关注 不 同 推荐 方法 所 需要 的 
知识 源 ， 并 把 与 这 些 推荐 方法 相关 联 的 约束 条 件 作为 选择 算法 的 人 门 指南 。 该 章 讨 论 了 针 
对 不 同 问题 选择 的 不 同 推荐 技术 的 适用 性 ， 并 提出 了 选择 这 些 技 术 的 决策 准则 。 

该 章 的 目的 很 明确 ， 就 是 为 系统 实现 者 “推荐 ”合适 的 推荐 技术 。 作 者 描述 了 不 同 领域 
的 推荐 系统 中 可 用 的 知识 库 以 及 确定 一 种 推荐 技术 时 所 不 可 获取 的 知识 库 。 这 就 意味 着 设 
计 推 荐 系统 首先 要 注重 的 是 分 析 知 识 库 的 来 源 ， 然 后 再 据 此 选择 算法 。 

第 12 章 记 述 了 男 一 个 需要 根据 领域 来 调整 推荐 方法 的 示例 ， 这 个 示例 关于 推荐 系统 
的 技术 增强 型 学 习 (TEL)。TEL 基本 覆盖 了 支持 各 种 形式 的 教学 活动 的 技术 ， 其 目的 是 
设计 、 发 展 和 测试 新 方法 与 技术 来 增强 个 人 和 组 织 双 方 的 学 习 实 践 能 力 。TEL 的 主要 收 - 
益 来 源 于 将 推荐 系统 技术 整合 到 个 性 化 学 习 过 程 中 ， 并 根据 用 户 先 前 的 知识 、 能 力 和 偏好 
逐步 调整 。 该 章 阐 述 了 能 满足 TEL 的 特定 需求 的 推荐 系统 ; TEL 设置 阶段 用 户 需 要 做 的 
任务 ; 其 他 推荐 系统 的 用 户 任 务 和 这 些 任务 有 什么 区 别 。 例 如 ， 对 TEL 来 说 ， 用 户 的 特 
殊 任务 是 “发 现 新 资源 ”>， 也 就 是 尝试 仅仅 推荐 新 的 或 者 新 奇 的 物品 。 或 者 ， 我 们 考虑 另 一 
个 例子 ， 即 “发 现 新 路 径 >， 也 就 是 通过 学 习 知识 库 推荐 可 选 的 路 径 。 该 章 提出 的 过 滤 方 法 
的 分 析 对 TEL 很 有 用 ， 有 关 现 有 TEL 系统 的 调查 显示 ， 推 荐 技术 已 经 被 部 署 到 系统 中 。 

第 10 章 讨论 了 推荐 系统 发 展 的 实践 方面 ， 目 的 在 于 为 推荐 的 设计 、 实 现 和 个 性 化 系 
统 的 评测 提供 指导 。 设 计 推 荐 系统 的 时 候 ， 除 了 考虑 预测 算法 ， 也 要 考虑 其 他 因素 。 第 10 
章 列 了 许多 因素 : 目标 用 户 的 种 类 和 他 们 的 上 下 文 、 需 要 用 的 设备 、 推 荐 系统 在 程序 中 的 
作用 、 推 荐 的 目标 ， 还 有 之 前 提 到 的 可 用 的 数据 。 

作者 建议 为 此 环境 搭建 一 个 三 维 模型 ， 三 个 维度 分 别 是 : 系统 用 户 、 数 据 特 征 和 程序 
的 综合 应 用 。 推 荐 系统 的 设计 要 基于 这 个 模型 。 作 者 阐述 了 其 指导 方案 以 及 建立 在 他 们 自 
己 开发 的 一 个 新 闻 推荐 系统 上 的 模型 。 

有 关 推 荐 系统 实际 部 署 方面 的 另 一 个 重要 的 问题 就 是 对 推荐 系统 的 测评 。 出 于 各 种 各 
样 的 目的 ， 推 荐 系统 生命 周期 的 不 同 阶段 都 要 进行 测评 L25，1]。 在 设计 时 ， 需 要 用 测评 
去 判定 推荐 算法 的 选择 。 在 设计 阶段 ， 测 评 过 程 是 离线 完成 的 ， 并 且 推 荐 算法 需要 拿 来 和 
用 户 交 互 作 比较 。 离 线 测评 包括 在 同一 个 用 户 互动 (如 评分 ) 数 据 集 上 运行 多 个 算法 并 且 比 
较 各 自 的 性 能 。 如 果 能 够 获得 合适 的 数据 ， 这 种 测评 通常 都 是 在 一 些 公开 的 基准 数据 上 进 
行 的 ， 和 否则， 就 要 在 自己 收集 的 数据 集 上 进行 。 为 了 确保 结果 的 可 靠 性 ， 离 线 实 验 的 设计 
需要 与 已 知 的 实验 设计 方法 保持 一 致 L11]。 

系统 上 线 运 行 以 后 依然 需要 评测 。 当 解决 一 些 核心 推荐 问题 (如 预测 用 户 评分 ) 时 ， 算 
法 可 能 需要 非常 精确 ， 但 是 有 些 情况 下 系统 可 能 不 会 被 用 户 接受 ， 例 如 ， 当 系统 的 表现 和 
用 户 期 望 的 不 一 致 时 。 实 施 在 线 评 测 并 且 分 析 系 统 日 志 以 增强 系统 性 能 就 显得 很 有 必要 
了 。 另 外 ， 大 多 数 算法 都 包含 参数 ， 如 阔 值 权重 、 近 邻 的 数量 等 ， 都 需要 不 断 地 调整 和 
校准 。 

另 一 种 测评 方法 是 当 在 线 测评 不 可 行 或 太 冒 险 的 时 候 ， 可 以 进行 一 个 集中 的 用 户 研 究 
(a focused user study) 。 在 这 类 测评 中 ， 需 要 实施 一 种 可 控制 的 实验 ， 即 一 小 群 用 户 被 要 
求 执行 随 着 系统 变化 的 不 同 的 任务 。 然 后 才 有 可 能 分 析 用 户 喜 好 以 及 分 发 调查 问卷 以 便 用 
户 报告 各 自 的 用 户 体验 。 在 这 样 的 实验 中 ， 我 们 一 般 能 够 收集 到 关于 系统 的 数量 大 、 质 量 
高 的 用 户 反馈 信息 。 


第 12 Eb Ut TEL 系统 环境 下 的 测评 方法 ， 对 测评 方法 和 工具 进行 了 详细 的 分 析 。 
这 些 方法 和 工具 可 以 用 来 在 一 组 特定 的 标准 下 评估 TEL 推荐 技术 ， 这 组 标准 是 与 每 个 选 
择 的 部 分 (如 用 户 模型 、 领 域 模型 、 推 荐 策略 和 算法 ) 相 对 应 的 。 

第 8 章 详细 阐述 了 用 于 评估 推荐 系统 的 三 种 实验 ， 并 阐述 了 它们 各 自 的 优 缺 点 ， 最 后 
为 测评 选择 方法 制定 了 指导 原则 。 通 常 文 献 中 有 关 评 估 的 讨论 都 会 提 到 算法 预测 的 精准 度 
及 相关 度量 方法 ， 本 章 则 独树一帜 ， 专 门 讨论 定向 特性 的 评估 。 除 了 精准 度 ， 还 给 出 了 一 
大 组 特性 。 每 个 特性 都 有 相应 的 实验 验证 和 度量 方法 。 这 些 特性 包括 覆盖 率 、 冷 启动 、 信 
心 值 、 可 信和 度 、 新 颖 性 、 风 险 度 和 惊喜 度 。 

当 讨论 推荐 系统 的 实践 方面 时 ， 我 们 最 好 分 析 真 实 实现 的 系统 。 我 们 的 想法 是 在 理论 
上 验证 直观 的 假设 ， 目 的 是 确定 它们 在 实践 中 是 否 成 立 。 但 是 我 们 必须 要 面 对 的 事实 是 ， 
商业 推荐 系统 的 所 有 者 通常 不 愿意 公开 他 们 真实 的 做 法 并 且 甚 至 连 这 样 合作 的 机 会 几乎 也 
没有 。 

第 9 章 介绍 了 一 个 这 样 的 时 机 并 阐述 了 一 个 真实 推荐 系统 的 操作 ， 由 此 说 明了 适用 于 
推荐 系统 实践 阶段 和 评估 过 程 的 实践 层面 。Fastweb 是 欧洲 最 大 的 IPTYV 服务 商 ， 本 章 着 
重 介绍 了 如 何 把 推荐 系统 整合 到 Fastweb 的 生产 环境 中 。 本 章 描述 了 需求 和 考虑 因素 ， 包 
括 规 模 和 准确 度 ， 而 这 些 正 是 选择 推荐 算法 的 主导 因素 。 除 此 之 外 ， 本 章 还 描述 了 系统 中 
用 到 的 离线 和 在 线 评测 方法 ， 并 且说 明了 系统 应 该 如 何 进行 相应 的 调整 。 


1.6 推荐 系统 与 人 机 交互 


正如 前 面 阐明 的 那样 ， 研 究 人 员 主 要 关注 一 系列 技术 解决 方案 的 设计 ， 以 及 利用 各 种 
知识 库 更 好 地 预测 目标 用 户 喜 欢 什么 和 喜欢 的 程度 。 这 种 研究 活动 背后 的 基本 假设 是 仅 能 
展示 正确 的 推荐 (也 就 是 最 好 的 选项 ) 就 足够 了 。 换 句 话说 ， 系 统 给 用 户 推 荐 ， 如 果 是 正确 
Sai 
用 户 并 不 简单 。 

实际 上 ， 因为 用 户 没有 足够 的 知识 库 做 明确 的 决定 ， 所 以 才 需 要 推荐 。 让 用 户 评 价 系 
统 提 供 推荐 并 不 是 件 容易 的 事情 。 因 此 ， 很 多 研究 人 员 试 图 了 解 让 指定 用 户 接受 推荐 结果 
的 因素 [105，30，24，97，33]。 

其 中 L105] 第 一 个 指出 推荐 系统 的 有 效 性 依赖 于 很 多 因素 ， 而 不 仅仅 是 预测 算法 的 质 
量 。 实际 上 ， 推荐 系统 必须 说 服用 户 去 尝试 (或 听 、 购 买 、 阅 读 、 看 ) 所 推荐 的 物品 。 当 
然 ， 这 取决 于 被 选择 物品 的 个 体 特征 ， 也 取决 于 推荐 算法 。 当 物品 被 推荐 、 比 较 、 解 释 
(解释 为 什么 被 推荐 ) 的 时 候 ， 该 过 程 也 取决 于 系统 支持 的 特定 的 人 机 交互 。[105] 发 现 ， 
从 用 户 角度 来 看 ， 一 个 有 效 的 推荐 系统 必须 能 激发 用 户 对 系统 的 信任 ; 它 必 须 有 一 个 显 而 
易 见 的 系统 逻辑 (个 人 理解 为 系统 不 能 有 逻辑 错误 )， 它 必须 指引 用 户 面向 新 的 、 用 户 不 熟 
” 悉 的 物品 ， 它 必须 提供 推荐 物品 的 详细 信息 ， 包 括 图 片 和 社区 评分 ， 最 终 ，[105] 提 供 改 
进 推荐 的 方法 。 

[L105] 和 其 他 相似 方向 的 研究 者 并 没有 忽略 推荐 算法 的 重要 性 ,但 是 他 们 声称 推荐 算 
法 的 有 效 性 不 能 仅 根据 预测 结果 的 准确 性 ( 即 用 标准 且 流 行 的 IR 指标 ， 如 MAE、 准 确 度 
或 NDCG) 来 衡量 ( 见 8.5 节 , 第 9 章 )。 他 们 认为 涉及 用 户 接受 推荐 系统 以 及 其 推荐 结果 
的 其 他 角度 也 应 该 被 测量 。 这 些 想 法 在 [33] 中 也 被 明确 地 提出 并 讨论 。 在 这 项 工作 中 ， 作 
者 提出 评价 推荐 系统 要 以 用 户 为 中 心 ， 包 括 推荐 列表 的 相似 度 ， 推 荐 系统 有 意外 新 发 现 的 
能 力 ， 以 及 推荐 系统 中 用 户 需 求 和 期 望 的 重要 性 。 
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讨论 过 [105] 提 出 的 观点 之 后 ， 我 们 介绍 由 人 机 交互 研究 引出 的 几 个 重要 观点 ， 我 们 
将 在 本 书 中 进一步 研究 人 机 交互 。 


1.6.1 信任、 解释 和 说 服 力 


首先 讨论 信任 。 本 书 讨论 了 关于 信任 的 两 种 不 同 概念 : 对 推荐 系统 其 他 用 户 的 信任 和 
对 推荐 系统 本 身 的 信任 。 

第 20 章 集 中 讨论 了 第 一 种 观念 ， 并 分 析 了 一 类 叫 作 “ 社 会 化 推荐 系统 ”的 推荐 系统 。 
这 些 系统 试图 从 用 户 资料 和 用 户 关系 中 推导 出 更 有 用 的 推荐 ,这 些 资料 和 关系 在 目前 几乎 
随处 可 见 ， 如 在 Facebook, Linkedln fll MySpace 等 社交 网 站 中 。 由 于 基于 信任 的 推荐 系 
统 主要 利用 它们 在 社交 网 站 发 现 的 信任 关系 来 构造 新 的 推荐 算法 (如 [34])， 所 以 它们 在 核 
心 评 分 预测 问题 上 只 能 使 用 信任 关系 。 这 类 系统 的 主要 优势 是 用 户 可 以 知道 推荐 系统 的 本 
质 是 什么 ， 如 这 些 推 荐 结果 是 如 何 确定 的 ， 这 样 用 户 便 会 更 加 信任 这 些 推荐 结果 。 换 句 话 
说 ,我 们 可 以 利用 用 户 之 间 的 相互 信任 来 提高 用 户 对 推荐 系统 的 信任 度 。 

对 推荐 系统 产生 的 推荐 结果 的 信任 在 第 15 章 讨 论 。 该 章 主要 介绍 了 解释 推荐 的 作用 ， 
还 介绍 了 信任 是 推荐 解释 在 推荐 系统 扮演 的 七 大 作用 之 一 。 这 七 大 作用 是 : 透明 度 ， 即 说 
明 系 统 是 如 何 工作 的 ; 可 反馈 性 ， 即 允许 用 户 告诉 系统 有 错误 [50]; 信任 ， 即 增加 用 户 对 
系统 的 信心 ; 有效 性 ， 即 帮助 用 户 做 出 好 的 决定 ;说服 力 ， 即 说 服用 户 去 尝试 或 购买 ; 高 
效 性 ， 即 帮助 用 户 快速 抉择 ; 满意 度 ， 即 增加 用 户 舒 适度 或 乐趣 。 

该 章 也 阐述 了 一 系列 构造 解释 的 方法 。 如 协同 过 滤 方 法 ， 其 解释 的 形式 是 “ 跟 你 相似 
的 用 户 喜 欢 这 个 物品 >”。 在 基于 内 容 的 风格 解释 中 ， 系 统 会 根据 最 能 代表 物品 的 特征 属性 
把 物品 推荐 给 用 户 。 例 如 ， 电 影 推荐 系统 中 ， 一 种 推荐 形式 有 可 能 是 “这 部 电影 被 推荐 是 
因为 你 可 能 喜欢 Bruce Wills 这 个 明星 ”， 或 者 “物品 X 被 推荐 是 因为 你 对 物品 Y MZ YE UE 
很 高 ， 而 Y、Z 和 X 有 共同 的 属性 A 和 B”。 用 基于 案例 的 解释 ， 系 统 会 引用 与 推荐 物品 
相似 的 物品 ， 例 如 ,“ 这 个 物品 被 推荐 是 因为 你 说 自己 拥有 物品 X? 或 者 "这些 物 品 的 推荐 
是 基于 你 最 近 浏 览 的 物品 >”。 最 后 ， 用 基于 知识 库 的 风格 解释 ， 系 统 会 解释 推荐 物品 和 另 
一 个 物品 的 差异 ， 并 且 会 说 推荐 物品 是 如 何 符合 用 户 目标 的 :“ 这 个 房间 面 朝 大 海 ， 并 且 
比 之 前 推荐 的 房间 大 ， 这 将 更 加 浪漫 ， 如 你 所 愿 。” 

回 到 信任 的 话题 上 来 ， 我 们 把 它 视 为 实现 推荐 系统 主要 目标 ， 即 说 服用 户 接 受 推 荐 结 
果 并 且 尝 试 推荐 的 物品 。 这 个 问题 最 终 与 整个 推荐 系统 的 说 服 力 有 关 ， 即 推荐 系统 的 各 个 
因素 ， 包 括 推荐 什么 ， 如 何 推荐 ， 在 人 机 交互 过 程 中 实际 是 如 何 运作 的 。 这 个 话题 将 在 第 
14 章 有 所 讨论 。 在 这 里 ， 作 者 强调 说 推荐 系统 应 该 值得 信赖 并 且 经 常 被 人 们 想到 。 当 人 
们 想到 使 用 推荐 系统 时 ， 不 仅仅 是 因为 他 们 知道 它 能 产生 推荐 结果 ， 而 且 是 把 它 当 作 一 个 
建议 给 予 者 。 实 际 上 ， 关 于 说 服 力 的 文献 资料 表明 人 们 容易 接受 来 自 可 靠 消 息 的 推荐 ， 所 
以 我 们 得 到 结论 : 推荐 系统 的 可 靠 性 对 于 增加 用 户 接受 推荐 结果 的 可 能 性 是 至 关 重 要 的 。 
因此 ， 作 者 讨论 了 推荐 系统 的 可 信 度 是 如 何 提高 的 ， 并 且 提 供 了 有 关 信 任 度 研究 的 概要 。 


1.6.2 会 话 系统 


推荐 系统 算法 的 另 一 个 严格 限制 是 这 些 算法 被 设计 为 一 次 性 收集 输入 数据 ， 而 且 一 旦 
返回 推荐 结果 便 结束 整个 过 程 。 在 很 多 情况 下 ， 这 种 模型 会 失效 ， 因 为 用 户 还 不 能 完全 意 
识 到 自己 的 喜好 ， 除 非 他 们 与 系统 进行 一 定 程度 交互 并 且 大 致 了 解 选 择 的 范围 。 或 者 在 确 
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信 一 些 可 能 适合 自己 的 推荐 之 前 会 浏览 更 多 的 可 选择 的 选项 。 这 也 可 能 意味 着 系统 一 开始 
的 推荐 就 是 错误 的 ， 但 用 户 可 能 愿意 提供 额外 的 信息 用 于 修复 这 些 问 题 ， 最 终 得 到 一 些 好 
的 推荐 。 

这 些 问题 已 经 得 到 了 致力 于 “会 话 式 推荐 系统 ”[27，110，67，60j] 的 研究 人 员 的 重视 
并 解决 。 会 话 式 推荐 系统 为 预测 评分 或 排序 使 用 了 各 种 技术 。 然 而 ， 这 些 技术 都 在 试图 提 
供 交 互 过 程 ， 该 过 程 中 ， 用 户 和 系统 能 彼此 查询 或 提供 信息 。 最 具 决 定性 的 问题 是 如 何 设 
计 这 个 会 话 ( 也 就 是 会 话 策略 )， 以 及 如 何 设计 用 户 和 系统 在 交互 的 各 个 阶段 必须 执行 的 动 
作 。 提 供 的 会 话 必 须 有 效 ， 即 当 用 户 终止 会 话 时 应 该 得 到 解决 方案 (如 预订 机 票 );， 而 且 速 
度 要 快 (会 话 步骤 较 少 )。 在 本 手册 中 ， 有 两 章 处 理 这 一 重要 话题 。 

第 13 章 提供 了 基于 评价 的 推荐 系统 的 研究 综述 。 给 定 一 个 关于 用 户 偏 好 信息 的 初始 
集 (例如 ， 一 些 物品 特征 的 优选 值 );， 基 于 评价 的 界面 或 者 会 话 模 型 能 够 展示 给 用 户 推荐 的 
物品 以 及 支持 用 户 表 述 “ 评 价 ”， 例 如 ,，“ 给 我 展示 更 多 像 A 的 物品 ， 但 是 比 A 更 便宜 ”。 

基于 评价 的 系统 已 经 在 一 些 领域 中 得 到 了 很 大 的 关注 ， 在 这 些 领域 中 ， 我 们 需要 一 个 
更 加 复杂 且 具 有 交互 性 的 决策 /推荐 支持 系统 ， 如 旅游 领域 L[88，32，100] 或 者 计算 机 系统 
领域 L[82，83]。 基 于 评价 的 系统 最 初 的 设计 是 用 于 有 效 地 解决 用 户 偏 好 提取 问题 的 ， 但 是 
现在 已 经 对 其 他 目的 或 应 用 变 得 非常 重要 ， 例 如 ， 小 组 推荐 、 初 始 混合 推荐 、 用 户 自 适应 
交互 接口 、 解 释 推 荐 、 移 动 推荐 。 

男 一 种 与 会 话 系统 有 关 的 方法 是 基于 偏好 的 [67]。 基 于 偏好 和 基于 交互 的 方法 相似 ， 
因为 他 们 都 是 在 之 前 就 给 用 户 一 些 推 荐 ， 这 些 推 荐 也 许 不 会 是 最 好 的 ， 但 是 总 有 一 部 分 的 
物品 能 引起 用 户 的 兴趣 。 这 种 额外 的 信息 能 帮助 提高 系统 表现 用 户 偏 好 (用 户 模型 ) 的 能 
力 ， 从 而 能 使 系统 产生 新 的 且 更 好 的 推荐 。 

第 16 章 阐 述 了 这 些 新 颖 的 方法 和 系统 ， 集 中 讲 了 这 种 基于 偏好 推荐 系统 的 用 户 ， 即 
系统 交互 的 三 个 方面 : 初始 偏好 提取 ; 偏好 修正 ;推出 推荐 结果 。 本 章 的 内 容 可 以 作为 来 
源 于 一 些 系 统 的 可 用 性 指南 的 集合 ， 这 些 指南 可 被 广泛 和 大 规模 应 用 。 而 且 ， 为 了 选择 指 
导 准 则 ， 作 者 不 仅 关 注 准确 性 这 一 个 指标 ， 还 考虑 到 这 样 的 一 个 事实 : 人 类 的 认 知 资源 有 
限 ， 因 此 如 果 需 要 我 们 付出 过 多 的 努力 ， 将 不 大 可 能 会 得 到 高 准确 度 的 结果 。 他 们 选择 的 
方法 能 产生 准确 度 很 高 的 推荐 结果 ， 同 时 要 求 的 努力 程度 是 我 们 愿意 接受 的 。 

之 前 提 到 的 方法 (基于 交互 的 和 基于 偏好 的 ) 已 经 主要 应 用 于 基于 案例 的 推理 系统 
[22]， 这 类 系统 的 检索 部 分 是 依赖 相似 性 度量 的 。 在 这 种 情况 下 ， 由 于 在 一 定 程度 上 ， 产 
品 总 是 跟 一 个 可 探测 (查询 ) 结 果 类 似 ， 所 以 一 条 查询 可 以 检索 出 目录 下 的 所 有 产品 ， 并 对 
这 些 产 品 进行 排序 。 如 果 查 询 语言 支持 其 他 限制 条 件 ( 例 如 ， 等 同 限制 或 排序 限制 )， 查 询 
返回 的 结果 可 能 不 会 令 人 满意 [47，71，31]。 针 对 这 种 情况 ， 研 究 人 员 提 出 了 许多 技术 ， 
这 些 技术 通过 放宽 约束 的 最 小 数量 来 修复 这 种 查询 问题 ， 其 目的 是 使 返回 的 查询 结果 令 人 
满意 。 这 个 课题 也 在 专 讲 基于 约束 (第 6 章 ) 的 推荐 系统 中 有 所 讨论 。 


1.6.3 可 视 化 


目前 ， 我 们 重点 强调 了 人 机 交互 问题 ， 而 这 些 问 题 已 经 在 推荐 系统 的 研究 中 得 以 解 
决 ， 本 手册 也 对 此 进行 了 讨论 。 总 之 ， 我 们 认为 系统 如 何 展示 并 且 可 视 化 计算 得 到 的 推荐 
结果 是 影响 用 户 接受 推荐 结果 和 该 推荐 系统 的 关键 因素 。 

推送 (将 推荐 推 到 用 户 那里 ) 和 解释 技术 是 不 可 分 的 : 一 个 好 的 推送 技术 也 要 有 解释 扒 
荐 的 能 力 ， 也 要 诱导 用 户 提出 进一步 请 求 ， 包 括 对 解释 推荐 的 请 求 。 目 前 已 有 的 这 些 技术 
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有 一 个 共同 点 ， 就 是 推荐 结果 按照 物品 列表 的 方式 显示 。 推 荐 列表 长 度 是 可 变 的 ， 但 是 核 
心 推荐 算法 的 输出 通常 是 个 排序 列表 ， 该 列表 在 最 终 展示 推荐 结果 时 会 用 到 。 

本 书 单 设 一 章 阔 明 一 种 有 别 于 传统 模式 的 推送 方法 。 在 第 17 章 ， 作 者 注意 到 在 排序 
列表 这 种 可 视 化 方法 中 丢失 了 大 部 分 信息 。 这 里 的 原因 是 : 对 于 两 个 产品 ， 即 使 它们 都 与 
用 户 请 求 或 者 用 户 模 型 相 匹 配 ， 但 如 果 是 基于 完全 不 同 的 产品 特征 集 ， 也 是 有 区 别 的 。 如 
果 用 一 个 二 维 的 基于 图 的 可 视 化 推荐 ， 还 可 能 保留 部 分 信息 。 在 图 中 ， 我 们 可 以 在 一 个 受 
限 的 范围 内 为 各 个 相似 推荐 安排 位 置 。 该 章 提 出 了 建立 二 维 图 推荐 的 两 种 方法 ， 并 且 讨论 
了 各 自 的 优 缺点 。 


1.7 推荐 系统 是 个 交叉 学 科 领 域 


设计 和 开发 推荐 系统 是 多 个 学 科 共 同 努力 的 结果 ， 这 得 益 于 多 个 计算 机 科学 领域 的 成 
果 ， 特别 是 机 器 学 习 、 数 据 挖 据 、 信 息 检 索 和 人 机 交互 。 这 在 本 书 章节 中 和 上 述 讨 论 可 以 
明显 地 看 出 来 。 在 此 ， 简 要 地 梳理 一 下 这 些 关 系 。 

机 器 学 习 和 数据 挖掘 ， 是 人 工 智能 的 子 领 域 ， 它 们 是 让 计算 机 学 习 示 例 、 数 据 或 过 去 
的 经 验 从 而 使 其 执行 某 些 任务 时 性 能 最 佳 L109j]。 人 例如， 购买 ”Da Vinci Code” 的 顾客 也 买 
J “The Five People You Meet in Heaven”， 数 据 挖掘 就 可 以 利用 这 类 交易 数据 进行 学 习 。 
因此 ， 可 以 用 这 种 相互 关联 信息 构建 推荐 系统 。 

为 了 预测 用 户 对 物品 的 评价 ， 或 者 为 了 学 习 如 何 修正 推荐 列表 排序 ， 许 多 推荐 系统 以 
利用 各 种 机 器 学 习 和 数据 挖掘 算法 为 中 心 。 本 书 第 2 章 对 上 下 文 推荐 系统 预 处 理 方法 使 用 
到 的 数据 挖掘 技术 做 了 总 述 ， 例 如 ， 抽 样 或 降 维 ;分 类 技术 ， 如 贝 叶 斯 网 络 和 支持 向 量 机 
的 方法 ; 聚 类 技术 ， 如 k-means 算法 ; 关联 规则 。 

其 他 例证 推荐 系统 和 数据 挖掘 关系 的 章节 是 : 第 12 章 讨 论 了 利用 主动 学 习 获 取信 
息 ; 第 5 章 建立 预测 评分 模型 的 最 优化 技术 ; 第 7 章 介 绍 利用 上 下 文 数据 提供 了 各 类 预 
测评 分 模型 ;第 24 章 介 绍 数 据 挖掘 技术 ， 利 用 多 准则 的 物品 评价 标准 ， 更 好 地 预测 用 
户 综 合 评价 ; 第 25 章 重 点 讲 了 数据 挖掘 的 推荐 系统 攻击 检测 方法 ， 建 立 健壮 性 算法 的 
解决 方案 ; 第 4 章 曾 述 目前 基于 学 习 的 协同 过 滤 系 统 的 很 多 实例 ; 第 19 RAR TRA 
矩阵 或 超 边 ( 用 户 、 资 源 、 标 签 ) 的 超 图 的 数据 挖掘 解决 方法 ; 第 20 章 介绍 数据 挖掘 的 
信任 网 络 解决 方法 。 

信息 检索 (IR) 的 目的 是 帮助 用 户 存储 和 检索 各 种 不 同形 式 的 内 容 ， 如 文本 、 图 像 、 视 
频 [63]。 利 用 信息 检索 工具 ， 用 户 可 以 很 快 找到 自己 需要 的 有 关 的 信息 和 全 面 的 信息 。 虽 
然 IR 并 不 始 于 Web, (AHF Web 搜索 引擎 的 发 展 ， 万 维 网 在 开创 这 一 新 观念 方面 扮演 了 
重要 的 角色 。 

信息 检索 和 推荐 系统 都 面临 着 过 滤 和 排序 问题 。IR 一 般 重 点 发 展 全 局 检索 技术 ， 通 
常 忽略 个 体 需要 和 用 户 偏 好 。 而 [25] 声 称 ， 推 荐 系统 还 没有 明显 地 与 信息 检索 分 离 。 推 荐 
系统 和 信息 检索 或 搜索 引擎 最 核心 的 区 别 是 “考虑 个 体 ”与 “用 户 感 兴趣 和 对 用 户 有 用 ”， 而 
推荐 系统 正 尝试 在 这 方面 取得 成 功 。 

目前 ， 现 代 的 Web 搜索 引擎 已 经 依赖 推荐 技术 来 解决 Web 搜索 的 挑战 ， 实 现 更 先进 
的 搜索 功能 。 例 如 ， 搜 索引 人 擎 给 用 户 查 询 推荐 相似 查询 。 各 种 搜索 引擎 也 试图 通过 产生 用 
户 查 询 结 果实 现 个 性 化 ,， 拨 回 的 结果 不 仅 根据 用 户 查 询 条 件 还 要 参考 用 户 上 下 文 ( 例 如 ， 
他 的 位 置 ) 和 他 的 检索 历史 。 

第 18 章 讨论 了 IR 的 研究 目标 ， 涉 及 从 推荐 系统 角度 实现 Web 检索 个 性 化 。 作 者 阅 
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述 了 如 何 应 用 推荐 系统 技术 解决 搜索 引擎 面临 的 挑战 。 该 章 的 重点 是 改进 搜索 引擎 的 两 个 
有 希望 实现 的 想法 : 个 性 化 和 协同 。 该 章 描 述 了 利用 用 户 偏好 和 上 下 文 信息 影响 搜索 结果 
的 一 系列 不 同 的 方法 ， 去 实现 个 性 化 Web 搜索 。 另 外 ， 该 章 讨论 了 协同 信息 检索 方面 目 
前 要 做 的 工作 ， 协 同 信息 检索 尝试 利用 潜在 的 合作 关系 (朋友 间 、 同 事 间 或 者 有 相似 需求 
的 用 户 间 ) 实 现 一 系列 的 信息 检索 任务 。 这 种 新 型 的 研究 叫 作 社交 检索 ， 得 益 于 社交 网 络 
中 的 特性 ， 检 索 结 果 受 用 户 偏好 和 用 户 经 验 影响 。 作 者 预见 “推荐 系统 和 检索 系统 的 汇 
聚 "， 并 且 相 信 在 搜索 引擎 算法 上 这 些 资源 的 整合 可 以 产生 用 户 的 高 满意 度 ， 让 用 户 能 在 
正确 的 时 间 收 到 正确 的 信息 。 

跟 IR 研究 相关 同时 又 阐述 这 方面 研究 的 是 : 第 19 章 针对 上 下 文 标签 的 检索 问题 ;第 
3 章 介绍 了 根植 于 当前 搜索 引擎 技术 的 基于 上 下 文 方法 的 概述 。 

最 后 ， 推 荐 系统 最 终 目 标 是 给 用 户 提供 有 用 的 信息 ， 因 此 ， 在 推荐 最 终 能 否 被 接受 这 
个 问题 上 ， 人 机 交互 起 了 重大 作用 。 实 际 上 ， 许 多 领域 的 研究 清楚 地 表明 ， 从 用 户 角度 来 
A, HCI 中 与 系统 可 用 性 相关 的 方面 对 用 户 是 否 愿意 使 用 推荐 系统 以 及 为 了 更 有 效 的 推荐 
结果 而 提供 主动 的 输入 有 巨大 的 影响 。 这 些 问题 在 1. 6 节 讨 论 过 。 


1.8 ”出现 的 问题 和 挑战 
1.8.1 本 书 对 出 现 的 问题 的 讨论 


从 前 面 的 讨论 可 以 很 明显 地 看 出 ， 推 荐 系统 的 研究 正在 向 众多 不 同 的 方向 发 展 ， 同 时 
新 的 主题 不 断 出 现 ， 或 者 正成 为 更 重要 的 研究 课题 。 读 者 也 可 以 参考 最 近 的 ACM RecSys 
会 议 资 料 ， 参 考 其 他 优秀 的 论文 ， 将 其 作为 额外 的 研究 素材 L7，3]。 本 手册 中 涵盖 许多 这 
种 话题 。 实 际 上 ， 很 多 已 经 介绍 过 了 ， 例 如 ， 上 下 文 感知 推荐 (第 7 55 新 的 可 视 化 技术 
CR 17 章 ); 基于 社区 的 个 性 化 搜索 (第 18 章 ); 基于 信任 的 推荐 系统 (第 20 章 )。 其 他 一 
些 重 要 的 话题 在 手册 最 后 两 部 分 ， 我 们 现在 简短 地 介绍 一 下 这 些 章节 。 

”第 19 章 介绍 社会 标签 系统 (STS) ， 这 是 随 着 Web 2.0 的 发 展 而 出 现 的 跟 推 荐 系统 相 
关 的 新 话题 。STS 如 同 Flickr, Bibsonomy, Delicious 这 类 网 站 一 样 ， 人 允许 普通 用 户 发 表 
和 编辑 内 容 ， 同 样 也 允许 用 户 产 生 和 共享 标签 ( 即 自 定 义 关键 字 ) 。STS 用 户 正 面临 着 信息 
过 载 问 题 ， 因 为 STS 有 数 以 百 万 计 的 用 户 ， 他 们 进入 系统 后 发 表 的 内 容 和 标签 不 受 控 制 ， 
这 就 给 传统 的 推荐 系统 造成 检索 困难 。 因 此 ， 需 要 推荐 系统 来 帮助 用 户 找到 相关 的 信息 ， 
于 是 许多 商业 STS 开始 提供 推荐 服务 (如 Delicious) 。 

该 章 讨 论 了 STS 推荐 系统 面 对 的 新 挑战 ， 如 推荐 系统 的 新 任务 。 这 些 不 仅 包括 传统 
的 内 容 推 荐 也 包括 相关 标签 推荐 ， 甚 至 其 他 相似 用 户 推 荐 。 标 签 推荐 系统 ( 即 推荐 给 用 户 
一 个 物品 的 相近 标签 )， 与 传统 的 推荐 系统 有 很 多 独特 性 ， 因 为 系统 可 以 推荐 经 常 出 现 的 
标签 ， 不 像 传统 的 推荐 系统 一 般 不 对 相同 物品 进行 二 次 推荐 。 另 外 ，STS 的 推荐 系统 解决 
的 是 三 维 问题 (用 户 、 资 源 、 标 签 )， 而 不 是 传统 推荐 系统 的 二 维 问题 (用 户 、 物 品 )， 这 个 
问题 会 影响 算法 的 复杂 性 。 该 章 有 一 项 最 新 调查 ， 是 关于 支持 STS 的 新 一 代 推 荐 系统 的 。 
详 述 了 给 真实 STS 系统 部 署 推荐 系统 遇 到 的 挑战 ， 并 且 为 解决 STS 和 标签 推荐 系统 面临 
的 挑战 提供 了 新 的 算法 。 

第 21 章 处 理 这 样 的 情形 ， 就 是 系统 最 好 能 够 给 一 群 用 户 推 荐 信息 或 物品 ， 而 不 是 给 
单个 用 户 推 荐 。 例 如 ， 推 荐 系统 可 以 为 一 个 群 组 选择 电视 节目 ， 或 者 推荐 歌 单 ， 其 模型 是 
基于 整体 群 组 成 员 的 。 为 群 组 推荐 很 明显 要 比 为 个 体 推荐 更 复杂 。 假 设 我 们 能 精确 地 知道 
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单个 用 户 喜 好 ， 那 么 问题 就 是 如 何 组 合 单个 用 户 模 型 。 在 本 章 中 ， 作 者 讨论 了 群体 推荐 如 
何 工作 ， 面 临 的 问题 ， 目 前 的 进展 。 

第 22 章 讨论 了 聚合 用 户 偏好 、 准 则 和 相似 度 这 一 普遍 性 问题 。 通 常 这 类 聚集 是 通过 
利用 算术 平均 值 或 最 大 最 小 值 函数 完成 的 。 但 是 许多 其 他 有 灵活 性 和 适应 性 ， 并 且 最 终 能 
产生 更 相关 的 推荐 结果 的 聚合 函数 经 常 被 忽略 。 在 本 章 ， 作 者 回顾 了 聚集 函数 的 基础 和 特 
性 ， 并 且 介 绍 了 最 重要 的 几 个 ， 包 括 广义 集群 ，Choquet 积分 和 Sugeno 积分 ， 有 序 加 权 
平均 ， 三 角 模 自生 成 ， 双 极 性 聚合 函数 。 这 种 函数 可 以 模拟 输入 条 件 之 间 的 各 种 相互 作 
用 ,包括 连续 的 、 分 散 的 和 混合 的 行为 。 l 

在 第 23 章 中 ， 作 者 着 重 讲 了 推荐 系统 的 另 一 个 重要 问题 ， 即 推荐 系统 生命 周期 过 程 
中 需要 积极 寻找 新 数据 的 问题 。 这 个 问题 通常 被 忽略 ， 因 为 用 户 访问 系统 时 ， 系 统 就 假设 
没有 足够 大 的 空间 管理 系统 收集 的 数据 (如 评分 )。 实 际 上 ， 推 荐 系统 可 以 激发 用 户 兴趣 ， 
许多 系统 在 推荐 过 程 中 明确 地 询问 用 户 偏好 。 因 此 ， 通 过 调整 推荐 过 程 ， 用 户 可 以 提供 一 
系列 不 同 的 信息 。 特 别 是 系统 可 以 要 求 用 户 评价 特定 商品 ， 用 户 对 这 些 物品 的 评价 在 特定 
的 条 件 下 是 非常 有 用 的 ， 比 如 ， 为 一 些 用 户 或 者 整个 用 户 群 体 产生 更 加 多 样 化 的 推荐 结 
果 ， 或 者 简单 地 提高 系统 的 预测 准确 性 。 此 时 ， 主 动 学 习 出 现 了 ; 主动 学 习 可 以 增强 推荐 
系统 ， 帮 助 用 户 更 了 解 自 己 的 偏好 ， 产 生 更 有 效 和 更 有 用 的 问题 。 同 时 ， 主 动 学 习 可 以 为 
系统 提供 新 信息 ， 为 随后 的 推荐 作 分 析 。 因 此 ， 推 荐 系统 应 用 主动 学 习 能 使 推荐 过 程 个 性 
化 L61]。 这 可 以 通过 允许 系统 积极 地 影响 用 户 遇 到 的 物品 (例如 ， 在 用 户 注 册 或 用 户 定 期 
使 用 时 给 用 户 展示 物品 ) 来 完成 ， 同 样 也 可 以 通过 用 户 自由 探索 自己 的 偏好 来 完成 。 

第 24 章 介绍 了 另 一 个 新 兴 话 题 ， 即 多 准则 推荐 系统 。 多 数 推荐 系统 通常 是 考虑 单一 
标准 值 来 决定 物品 的 效用 ， 例 如 ， 整 体 评价 或 者 一 个 用 户 对 一 个 物品 的 评分 。 但 是 目前 这 
个 假设 被 认为 具有 局 限 性 。 因 为 用 户 做 选择 的 时 候 ， 系 统 为 一 个 特定 用 户 推荐 的 物品 是 否 
合适 要 根据 用 户 考虑 的 多 方面 因素 判断 。 多 准则 的 组 合 可 以 影响 用 户 意 见 ， 从 而 产生 更 有 
效 更 精确 的 推荐 。 

第 24 章 提供 了 多 准则 推荐 系统 的 一 个 概述 。 首 先 ， 它 把 推荐 问题 定义 为 一 个 多 准则 
决策 问题 ， 并 且 回 顾 了 支持 多 准则 推荐 实现 的 方法 和 技术 。 随 后 ， 集 中 讨论 了 多 准则 评分 
推荐 技术 的 分 类 ， 这 种 技术 主要 是 根据 物品 在 不 同 准则 上 的 评分 向 量 对 用 户 效 用 模型 建 模 
来 产生 推荐 的 。 给 出 了 有 关 利 用 多 准则 评分 计算 评分 预测 值 并 生成 推荐 的 当前 算法 的 概 
述 。 该 章 包括 这 些 推荐 系统 的 有 争议 问题 和 未 来 面临 的 挑战 。 

本 书 最 后 一 章 ( 第 25 章 ) 概 述 了 安全 方面 的 话题 。 这 个 话题 在 过 去 几 年 是 一 个 重要 问 
题 。 目 前 这 个 话题 的 工作 在 [28，45，102，112] 有 介绍 。 该 章 分 析 能 产生 更 具 健 壮 性 推荐 
的 算法 设计 ， 即 推荐 不 易 受 到 恶意 用 户 影 响 。 实 际 上 ， 协 同 过 滤 推 荐 系统 依赖 用 户 信 誉 ， 
即 默认 假设 用 户 与 系统 相互 作用 的 目的 是 为 自己 得 到 好 的 推荐 ， 从 而 给 邻居 提供 有 用 的 数 
据 。 然 而 ， 在 某 些 情况 下 用 户 与 推荐 系统 的 交互 有 一 系列 的 目的 ， 这 些 目的 可 能 是 与 系统 
所 有 者 或 系统 多 数 使 用 者 背道而驰 的 。 也 就 是 说 ， 这 些 用 户 想 去 破坏 推荐 系统 网 站 或 者 干 
预 提 供给 访客 的 推荐 ， 例 如 ， 给 一 些 物 品 更 高 的 分 数 或 更 低 的 分 数 ， 而 不 是 进行 公正 的 
评价 。 

该 章 作者 提出 一 个 有 效 的 攻击 模型 ， 这 种 攻击 的 成 本 很 低 ， 但 是 对 系统 输出 产生 的 影 
响 很 大 。 由 于 这 些 攻击 可 以 在 攻击 网 站 时 运行 良好 ， 因 此 很 有 必要 检测 它们 并 尽快 制定 对 
策 。 同 时 ， 研 究 人 员 已 经 研究 出 许多 能 经 受 攻击 的 健壮 性 算法 ， 而 且 与 有 效 攻击 相 比 ， 这 
些 算法 具有 较 低 的 影响 曲线 。 这 些 方法 在 本 章 中 也 涉及 了 。 利 用 这 些 技术 的 结合 ， 研 究 人 





员 考 虑 的 不 再 是 避免 攻击 而 是 去 控制 攻击 的 影响 ， 让 他 们 付出 高 昂 的 代价 。 
1.8.2 挑战 


新 兴 的 具有 挑战 性 的 推荐 系统 话题 ， 不 限于 我 们 上 面 提 到 的 章节 中 描述 的 那些 。 此 
外 ， 覆 盖 所 有 的 主题 并 不 在 这 个 简短 介绍 的 范围 内 。 读 者 可 以 参考 本 书 最 后 的 讨论 部 分 ， 
讨论 其 他 值得 关注 的 问题 。 

re ee a 

Wee ioa ie 这 些 内 容 。 

大 的 真实 数据 集 背景 下 的 算法 扩展 性 。 随 着 核心 技术 进步 与 成 熟 的 研究 ， 算 法 扩 
展 性 明显 成 为 推荐 系统 的 重要 问题 ， 它 决定 着 如 何 把 核心 推荐 技术 嵌入 真实 系统 
里 ， 如 何 处 理 用 户 和 物品 互动 (评分 、 人 和 偏好、 评论 等 ) 产 生 的 大 量 动态 的 数据 集 。 
有 个 方法 是 在 相对 较 小 的 数据 集 离线 测试 ， 但 这 个 方法 在 非常 大 的 数据 集 上 可 能 
失效 或 者 完全 不 适应 。 需 要 进行 新 方法 和 大 规模 的 评估 的 研究 L[91，92，33，38， 
116, 754. 75]. 

。 主动 推荐 系统 ， 即 虽然 没有 明确 的 请 求 L 90，24，62，80]， 推 荐 系统 也 产生 推荐 。 
到 目前 为 止 大 多 数 的 推荐 系统 都 遵循 一 个 “pull” 模 型 [ 94]， 用 户 为 获得 推荐 而 发 起 
请 求 。 时 变 境 迁 ， 计 算 机 无 处 不 在 ， 用 户 间 总 是 相连 的 ， 人 们 很 自然 地 想到 推荐 
系统 能 够 探测 到 隐藏 的 请 求 。 所 以 需要 预测 不 仅 是 推荐 什么 ， 还 要 考虑 什么 时 候 ， 
如 何 去 推送 推荐 。 这 样 推荐 系统 变 得 积极 主动 而 不 用 被 视 为 骚扰 。 

。 推荐 系统 中 的 用 户 隐 私 保 护 L81，26，79，56，17，28，102，16，5，53，70， 
114]。 推 荐 系统 利用 用 户 数据 产生 个 性 化 推荐 。 在 尝试 建立 更 多 更 好 的 推荐 系统 
时 ， 它 们 尽 可 能 多 地 收集 用 户 数据 。 这 无 疑 会 对 用 户 隐 私产 生 负 面 影 响 ， 用 户 可 
能 开始 觉得 系统 知道 太 多 关于 自己 真实 想法 的 信息 。 因 此 ， 需 要 设计 解决 方案 ， 
简约 并 明智 地 使 用 用 户 数 据 。 同 时 这 些 解决 方案 将 确保 用 户 信 息 库 不 被 恶意 用 户 
随意 获得 。 

。 推荐 给 目标 用 户 的 物品 多 样 性 [104，66，69，55，54，46，119]。 推 荐 列表 中 包 
含 的 物品 如 果 具 有 一 定 程度 的 多 样 性 ， 用 户 就 更 有 可 能 找到 合适 的 物品 。 为 受 限 
种 类 的 产品 做 完美 推荐 是 没有 意义 的 ， 除 非 用 户 已 经 表示 他 的 偏好 在 一 个 狭 罕 的 
范围 内 。 有 许多 情况 ， 特 别 是 在 推荐 过 程 的 早期 阶段 ， 用 户 想 要 探索 新 的 多 样 性 
的 方向 。 在 这 种 情况 下 ， 用 户 使 用 推荐 系统 作为 一 个 知识 发 现 工具 。 在 这 个 话题 
上 的 研究 仍 处 于 初级 阶段 ， 需 要 描述 “多 样 性 ”的 特性 ， 即 我 们 要 从 几 次 不 同 推荐 
中 还 是 从 一 次 推荐 中 寻找 多 样 性 ， 以 及 如 何 保证 推荐 精确 性 的 同时 兼 有 多 样 性 。 

。 在 建立 推荐 列表 的 过 程 中 整合 用 户 的 长 期 和 短期 偏好 [6，40，74]。 推 荐 系统 可 以 
分 为 两 类 : 一 种 是 建立 长 期 的 配置 资料 ， 通 过 聚集 所 有 系统 收集 的 用 户 交 易 数 据 
产生 推荐 (如 系统 过 滤 ); 另 一 种 更 侧重 于 用 户 的 短期 偏好 ， 例 如 ， 在 基于 案例 的 
方法 中 。 显 然 ， 在 解决 偏好 整合 问题 上 ， 这 两 方面 都 很 重要 ， 无 论 是 精确 的 用 户 
任务 还 是 物品 的 可 用 性 都 要 兼顾 。 实 际 上 ， 在 当 有 足够 的 证 据 表明 用 户 的 短期 偏 
好 与 长 期 偏好 发 生 偏 离 时 ， 需 要 建立 混合 模型 来 正确 地 决定 是 要 发 生 兴 趣 偏 移 ， 
还 是 不 要 偏向 用 户 的 偶然 偏好 。 

。 通用 的 用 户 模型 和 交叉 领域 推荐 系统 能 够 在 不 同 的 系统 和 应 用 领域 调配 用 户 数据 
[41， 18，52，19，20，49， 15], 使 用 通用 的 用 户 模型 技术 ， 一 个 单一 的 推荐 系 
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统 可 以 产生 多 种 物品 的 推荐 。 这 对 于 一 般 的 推荐 系统 是 不 可 能 的 ， 因 为 一 般 的 推 
荐 系统 能 够 把 多 种 技术 整合 到 一 个 混合 的 方法 中 ， 但 是 却 不 能 利用 在 一 个 领域 收 
集 到 的 用 户 偏好 信息 来 在 另 一 个 领域 产生 推荐 结果 。 

。 在 开放 式 网 络 中 运行 的 分 布 式 推荐 系统 L38，116，92，113，17，102]。 大 多 数 推 
荐 系统 的 计算 模型 是 典型 的 客户 端 -服务 器 结构 。 用 户 客 户 端 请 求 推荐 ， 推 荐 系统 
服务 端 产生 推荐 以 回应 请 求 。 这 显然 是 个 严重 的 限制 ， 受 到 集成 式 控制 系统 中 所 
有 传统 问题 的 折磨 。 新 兴 的 网 格 计算 或 云 计 算 的 出 现 ， 为 推荐 系统 实现 更 具 健 壮 
性 和 灵活 性 的 计算 模型 提供 了 良机 。 

。 最 优化 推荐 序列 的 推荐 系统 L120，99，10，59，61，107，106]。 我 们 已 经 提 到 过 
传统 的 推荐 系统 是 为 了 提高 推荐 质量 ， 这 依赖 一 个 简单 的 方法 : 一 次 性 的 请 求 / 响 
应 。 会 话 式 推荐 系统 可 以 通过 实现 学 习 能 力 进一步 提高 ， 不 仅 可 以 优化 推荐 的 物 
品 ， 而 且 可 以 优化 如 何 使 用 户 系 统 在 所 有 可 能 情况 下 都 能 展开 对 话 。 

。 移动 上 下 文 的 推荐 系统 L117，98，55，51，4，115，111，57，29，9，77，76， 
89，73，44，95，13]。 移 动 计算 作为 个 人 计算 最 自然 的 平台 。 当 用 户 移动 的 时 候 
可 能 产生 推荐 请 求 ， 例 如 ， 在 城市 旅游 时 的 超市 或 者 酒店 。 因 此 我 们 需要 使 用 户 
界面 “移动 ”起 来 (需求 是 “移动 ”的 )， 需 要 设计 能 充分 利用 有 限 的 移动 资源 (计算 能 
力 和 屏幕 尺寸 ) 的 计算 方案 。 

最 后 ， 在 结束 引言 之 前 ， 我 们 想 介 绍 一 些 额 外 的 挑战 ， 即 在 最 近 的 RecSys 会 议 中 一 
个 教程 中 讨论 的 ， 该 次 会 议 地 点 在 纽约 ， 时 间 是 2009 年 10 月 22 日 到 25 H, [ http: //rec- 
Sys. acm. org/tutorial3. pdf], John Riedl (Uni-versity of Minnesota), Todd Beaupre( Ya- 
hoo!) ffl John Sanders(Netflix) 提 出 研究 推荐 系统 的 八 个 重要 挑战 ， 透 明度、 探索 与 利用 、 
指导 准则 、 时 间 价 值 、 用 户 行 为 解释 、 评 价 推荐 系统 、 扩 展 性 、 学 术 / 工 业 之 间 关 系 。 

在 引言 中 已 经 讨论 过 一 些 问题 。 例 如 ， 当 讨论 解释 推荐 的 作用 时 介绍 了 透明 度 ， 我 们 
强调 透明 度 在 使 推荐 更 易 被 用 户 接 受 上 有 重大 作用 。 同 时 ， 推 荐 系统 的 评估 方法 (也 就 是 
评估 中 被 测量 的 一 系列 重要 角度 ) 这 个 话题 在 另 一 章 ( 第 8 章 ) 有 完整 的 阐述 。 

推荐 的 时 间 价 值 在 上 下 文 感知 推荐 系统 (第 7 章 ) 的 评论 部 分 讨论 过 。 然 而 ， 实 际 上 面 
临 的 挑战 是 ， 给 定 的 一 系列 推荐 不 可 能 永远 适用 ， 而 这 些 物品 需要 过 一 段 时 间 才 能 被 系统 
推荐 。 例 如 ， 当 谈 及 新 闻 物 品 时 ， 人 们 显然 想 要 了 解 最 新 发 生 的 事件 和 新 闻 ， 而 这 些 新 闻 
甚至 是 与 最 初 发 布 间隔 一 天 后 仍 不 能 被 推荐 给 用 户 。 

主动 学 习 ( 第 23 章 ) 对 探索 还 是 利用 的 话题 有 所 涉及 。 这 个 过 程 面临 的 挑战 也 是 设计 
师 必须 妥善 解决 的 主要 困境 ， 即 在 系统 当前 可 用 数据 的 给 定 条 件 下 ， 推 荐 目前 能 识别 出 的 
好 物品 ， 还 是 为 了 得 到 未 来 更 新 也 可 能 更 好 的 推荐 结果 ， 而 去 探索 用 户 的 偏好 (比如 ， 要 
求 用 户 对 额外 的 特定 物品 评分 )。 

索引 式 导 航 栏 ， 导 航 栏 指 的 是 将 传统 的 推荐 列表 ( 即 推荐 结果 ) 和 能 够 让 用 户 在 选项 中 
更 加 自主 浏览 的 工具 相 结 合 。 用 户 行为 解读 指 的 是 ， 除 了 用 户 显 式 评分 之 外 ， 还 可 以 探 
测 、 分 析 用 户 在 操作 推荐 系统 中 产生 的 更 多 行为 ， 并 用 于 构建 更 好 的 预测 模型 。 这 个 想法 
是 ， 每 个 用 户 的 用 户 行为 都 应 该 被 利用 在 推荐 过 程 中 。 但 是 解读 用 户 行为 ( 即 一 个 行为 的 
背后 意图 ) 是 个 挑战 ， 有 些 行为 需要 被 舍弃 ， 因 为 这 不 是 由 原来 真正 的 用 户 产生 的 ， 例 如 ， 
在 同一 个 浏览 器 中 不 同 用 户 执 行 的 行为 ， 或 者 是 虚假 和 恶意 注册 ， 或 者 是 由 机 器 人 和 有 息 忠 
引起 的 数据 或 日 志 。 

先前 也 提 到 过 可 扩展 性 。 我 们 强调 ， 很 显然 这 是 个 问题 ， 当 前 文献 中 对 这 个 问题 的 探 
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讨 并 不 完整 ， 因 为 可 扩展 性 一 直 被 大 多 数 工业 实践 者 研究 调查 。 

最 后 ， 关 于 工业 界 和 学 术 界 合 作 一 事 在 研讨 会 上 讨论 得 兴致 勃勃 。 工 业界 有 一 些 特殊 
的 问题 ,但 这 些 问题 没有 明确 地 公开 。 这 有 很 多 原因 ， 包 括 不 向 竞争 对 手 透 露 关键 信息 。 
相反 ， 学 术 界 正在 寻找 能 在 允许 的 时 间 和 资源 框架 内 解决 的 问题 ， 学 术 界 通常 会 专注 一 个 
能 对 科学 界 产生 影响 的 专题 。 这 种 不 同 会 使 工业 /学 术 合作 变 得 困难 。 但 是 推荐 系统 是 个 
需要 新 的 实际 挑战 的 领域 ， 这 些 挑 战 是 有 利于 解决 问题 或 使 问题 变 得 成 熟 的 。 如 果 我 们 不 
解决 那些 有 用 的 但 是 有 风险 的 挑战 ， 那 么 该 领域 的 研究 就 真正 有 停滞 不 前 的 风险 。 

我 们 希望 本 书 能 成 为 实践 工作 者 和 研究 人 员 的 有 用 工具 ， 有 助 于 在 这 个 令 人 激动 并 且 
有 用 的 研究 领域 进一步 开发 知识 。 这 样 我 们 相信 能 减少 两 组 人 员 ( 工 业 与 学 术 ) 走 不 同 路 线 
的 风险 。 目 前 推荐 系统 领域 极 大 地 得 益 于 工业 界 和 学 术 界 对 此 的 兴趣 和 努力 。 因 此 ， 当 他 
们 两 组 人 阅读 本 书 时 ， 我 们 都 会 奉 上 最 美好 的 祝愿 。 希 望 能 吸引 更 多 的 研究 者 在 这 个 非常 
有 趣 又 充满 挑战 的 领域 奋斗 ! 
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摘要 ”本章 概述 了 推荐 系统 中 用 到 的 一 些 重要 的 数据 挖掘 技术 。 首 先 描述 的 是 常见 的 
数据 预 处 理 方法 ， 如 抽样 和 降 维 。 其 次 ， 回 顾 推荐 系统 中 最 重要 的 分 类 技术 ， 包 括 贝 叶 斯 
网 络 和 支持 向 量 机 。 我 们 对 K-means 聚 类 算法 进行 描述 并 讨论 其 几 个 替代 算法 。 我 们 也 会 
介绍 有 效 训练 过 程 中 的 关联 规则 和 相关 算法 。 除 了 介绍 这 些 技 术 ， 我 们 也 会 考察 它们 在 推 
荐 系统 中 的 使 用 情况 ， 同 时 介绍 它们 成 功 应 用 的 案例 。 


2.1 简介 


推荐 系统 典型 地 运用 了 其 他 相 邻 领域 的 技术 和 方法 ， 如 人 机 交互 和 信息 检索 。 但 是 ， 
大 多 数 系统 的 核心 算法 都 可 以 理解 成 数据 挖掘 技术 的 一 个 特例 。 

数据 挖掘 的 过 程 一 般 由 三 个 连续 执行 的 步骤 组 成 : 数据 预 处 理 [59]j、 数 据 分 析 和 结果 
解释 ( 见 图 2. D. 。 我 们 将 在 2.2 节 中 分 析 一 些 最 重要 的 数据 预 处 理 方法 。 鉴 于 数据 抽样 、 
数据 降 维 、 距 离 函 数 在 推荐 系统 中 的 意义 及 所 担任 的 重要 角色 ， 我们 将 特别 关注 这 些 内 
容 。 从 2. 3 节 到 2.5 节 ， 将 总 体 介绍 在 推荐 系统 中 最 常 使 用 的 数据 挖掘 方法 : TR. OR 
类 、 关 联 规则 发 现 ( 图 2. 1 详细 显示 了 本 章 中 包含 的 不 同 主题 ) 。 


数据 
距离 度量 (2.1) 
数据 处 理 抽样 (2.2) 
主 成 分 分 析 (2.3.1) 

降 维 奇异 值 分 解 (2.3.2) 
最 近邻 (3.1) 
决策 树 (3.2) 
# (3.3) 

预测 份 类 贝 叶 斯 网 络 (3.0 


支持 向 量 机 (3.6) 


人 工 神经 网 络 (3.5) 
wea S) 


-means (4.1) 


描述 { 
ATE (42 
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图 2.1 数据 挖掘 中 主要 的 步骤 和 方法 及 其 对 应 的 章节 
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本 章 不 会 完整 回顾 数据 挖掘 方法 ， 而 是 强调 数据 挖掘 算法 在 推荐 系统 领域 中 的 影响 ， 
并 概述 已 经 成 功 应 用 的 主要 数据 挖掘 技术 。 感 兴趣 的 读者 可 以 进一步 参考 数据 挖掘 课本 
( 见 L28，73]) ， 或 参考 贯穿 全 章 的 引文 。 


2.2 数据 预 处 理 
我 们 把 数据 定义 为 一 组 对 象 及 其 属性 的 集合 ， 其 中 属性 定义 为 性 质 或 者 是 对 象 的 特 


征 。 对 象 的 其 他 名 称 包括 记录 、 物 品 、 得 分 、 样本 、 观察 值 或 者 实例 。 属 性 也 可 以 称 为 变 . 


量 、 字 段 、 特 性 或 者 特征 。 

真实 数据 通常 需要 经 过 预 处 理 ， 以 便于 机 器 学 习 技术 在 分 析 阶 段 使 用 。 本 节 紧 紧 围绕 
推荐 系统 设计 三 个 尤为 重要 的 问题 展开 。 首 先 ， 我 们 回顾 不 同 的 相似 度 ， 或 者 距离 度量 方 
式 。 其 次 ， 我 们 需要 讨论 抽样 问题 ， 一 种 可 以 减少 大 数据 集中 物品 数量 并 保持 其 主要 特征 
的 方法 。 最 后 ， 我 们 将 阐述 降 维 方法 中 最 常用 的 技术 。 


2.2.1 相似 度 度量 方法 


协同 过 滤 推 荐 备 受 青睐 方法 之 一 是 使 用 kNN 分 类 ， 我 们 将 在 2.3. 1 节 中 讨论 。 这 种 
分 类 技术 (如 同 大 多 数 的 分 类 和 聚 类 技术 ) 主 要 取决 于 定义 合适 的 相似 度 或 者 距离 度量 
方法 。 

最 简单 、 最 常用 的 距离 度量 是 欧 几 里 得 距离 : 


diey) = |D (aa — ye) (2.1) 


Kop. n 是 维 数 (属性 数 )，zs Alyn 分 别 是 数据 对 象 z Aly 的 第 & 个 属性 值 (分 量 )。 
闵可夫 斯 基 距 离 是 欧 几 里 得 距离 的 推广 : 


dizi) = (X; | 六 一 天 |) (2. 2) 
k=1 


其 中 ,~ 是 距离 的 度 ( 参 数 )。 取 决 于 7 AMAR, 一般 的 闵可夫 斯 基 距 离 有 专用 的 名 称 : 
r 二 1， 城 市 街区 (也 叫 曼哈顿 、 出 租车 、L1 范 数 ) 距 离 。 
r 一 2， 欧 几 里 得 距离 (L2 范 数 ) 。 


r 二 coO， 上 确 界 (Lx 或 Ls, 范 数 )， 这 是 任意 维度 对 象 属性 间 的 最 大 距离 。 
马 氏 距离 定义 如 下 : l 
d(x,y) = J(x—yo'(ir—y! (2.8) 


KB. o 是 数据 的 协 方差 矩阵 。 
一 个 常用 的 方法 是 把 物品 看 作 n 维 空间 的 文档 向 量 ， 并 且 计 算 它 们 相似 度 作为 形成 
夹 角 的 余弦 值 ， 其 公式 如 下 : 


(xe y) 
(r,y) = 7 pM (2. 4) 
cosh" Tz Ty 


其 中 ，。 表示 向 量 的 点 积 ，| z| 是 向 量 z 的 长 度 。 这 个 相似 度 称 为 余弦 相似 度 或 者 是 L2 
范 数 。 

物品 之 间 的 相似 度 还 可 以 用 他 们 的 相关 度 计算 ， 用 以 度量 对 象 间 的 线性 关系 。 尽 管 有 
几 个 相关 系数 可 能 被 应 用 ， 但 皮尔 逊 相关 性 系数 是 最 常用 的 。 给 出 点 工 和 2》 的 协 方差 及 它 
们 的 标准 差 c， 我 们 用 以 下 公式 计算 皮尔 逊 相关 性 : 
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_ (ry) (2. 5) 


Peason(C.r , y) : 
Oy X0, . 


推荐 系统 一 般 会 使 用 余弦 相似 度 式 (2. 40 aN E Je Rz AR EAT PE CX, EAT US VE E E RI y 
法 中 的 一 种 ， 如 加 权 方 案 )。 第 4 和 5 ETE TE D o] eb ae Pr s n] E ANS eC CHE, 但是， 
前 面 提 到 的 大 部 分 其 他 虐 离 度量 方法 都 可 能 用 到 ，Spertus [69 ] fE Orkut 社交 网 络 的 环 
境 中 做 了 大 规模 的 研究 来 评 佑 六 种 不 同 的 相似 度 度 量 方法 。 信 管 由 于 实验 的 特 蛛 设置 ， 结 
果 会 有 偏 益 ， 但 有 趣 的 是 余弦 相似 度 是 其 中 效果 最 好 的 度量 方法 。Lathia 等 L48] 也 做 了 一 
些 相似 度 度量 的 研究 ， 其 总 结 ， 在 一 般 的 案例 中 ， 推 荐 系统 的 预测 精确 性 不 受 相似 度 度量 
方法 选择 的 影响 。 事 实 上 ， 在 他 们 的 工作 中 ， 使 用 随机 的 相似 度 度量 有 时 会 产生 比 使 用 已 
知 任何 众所周知 的 方法 更 好 的 结果 。 

最 后 ， 在 一 些 只 有 三 进 制 属性 的 物品 案例 中 ， 可 以 采用 儿 个 相似 座 度 量 方 法 。 首 先 ， 
计算 MO01、M10、M11 和 Moo 数量 ， 其 中 Mol (64 x Ji o 同时 yy 是 1 这 个 属性 的 数量 ， 
M10 代表 zx 是 1 同时 > 是 0 这 个 属性 的 数量 ， 以 此 类 推 。 根 据 这 些 数值 我 们 可 以 计算 得 


TT MeL number of matches. E MII-FMOO i: 
51. Wi UG NGC SMC number of attributes MOI MIO t MOO- MII' Jaccard 系数 


IC= por MD EMT 广义 Jaccard(Tanimoto) 系 数 ， 是 JC 关于 连续 值 属性 或 计数 属性 


的 一 个 变型 ， 计 算 为 d = 


ee MES 
al? ay y 
2.2.2 抽样 


抽样 是 数据 挖 拨 从 大 数据 集中 选择 相关 数据 子 集 的 主要 技术 。 它 用 于 数据 预 处 理 和 最 终 
解释 步 又 中 。 之 所 以 使 用 抽样 是 因为 处 理 全 部 数据 集 的 计算 开销 太 大 。 它 也 可 以 被 用 来 创建 
训练 和 测试 数据 集 。 这 个 情况 下 ， 训 练 集 被 用 于 分 析 阶 段 学 习 参 数 或 配置 算法 ， 而 测试 集 被 
用 来 评估 训练 阶段 获得 的 模型 或 者 配置 ， 确 保 它 在 将 来 产生 的 未 知 数据 上 运行 良好 。 

抽样 的 关键 是 发 现 具 有 加 个 原始 数据 集 代表 性 的 子 集 ， 也 就 是 说 ， 其 具有 与 整个 数据 
集 大 概 类 似 的 兴趣 属性 。 最 简单 的 抽样 技术 是 随机 抽样 ， 任 意 物品 被 选中 的 概率 相同 。 但 
也 有 更 复杂 的 方法 。 例 如 ， 在 分 层 抽 样 中 数据 基于 特殊 特征 被 分 成 儿 个 部 分 ， 之 后 对 每 个 
部 分 独立 进行 随机 抽样 。 

最 常用 的 抽样 方法 包含 使 用 无 取代 的 抽样 ， 当 物品 被 选择 的 时 候 ， 物 品 被 从 整体 中 到 
走 。 但 是 ， 执 行 取代 抽样 也 是 可 以 的 ， 物 品 即 使 被 选择 也 不 用 从 整体 中 去 除 ， 允 许 同 样 的 
样本 被 选择 多 次 。 

在 分 离 训 练 集 和 测试 集 时 ， 通 常 做 法 是 做 用 80/20 的 训练 集 和 测试 集 比例 ， 并 使 用 无 
符 代 的 标准 随机 抽样 。 这 意味 着 我 们 使 用 无 牧 代 随机 抽样 方法 去 选择 20% 的 实例 为 测试 
集 ， 把 剩 下 的 80% 进 行 训 练 。80/20 的 比例 应 该 作为 一 个 经 验 规则 ， 一 般 来 说 ， 超 过 2/3 
的 任何 值 作为 训练 集 是 合适 的 。 

抽样 可 能 导致 过 特 妹 化 划分 的 训练 和 测试 数据 集 * 因 此， 训练 过 程 可 以 重复 好 几 次 ， 
从 原始 数据 集中 创建 训练 集 和 测试 集 ， 使 用 训练 数据 进行 模型 训练 并 且 使 用 测试 集中 的 样 
例 进行 测试 。 搂 下 来 ， 选 择 不 同 的 训练 /测试 集 进 行 名 练 /测试 过 程 ， 这 个 过 程 会 重复 K 
次 。 最 后 ， 给 出 K 次 学 习 模 型 的 平均 性 能 。， 这 个 过 程 是 著名 的 交叉 验证 。 交 叉 验 证 技术 
有 很 多 种 。 在 重复 随机 样本 中 ， 标 准 的 随机 抽样 过 程 要 执行 K 次 。 在 折 交 叉 校 验 中 ， 
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数据 集 被 分 成 4 份 。 其 中 一 份 被 用 来 测试 模型 ， 剩 下 n 一 1 份 被 用 来 进行 训练 。 交 叉 验 证 
过 程 重 复 n 次 , 个子 样 本 中 每 一 个 子 样本 都 只 使 用 一 次 作为 验证 数据 。 最 后 ， 留 一 法 
(LOO) 可 以 看 作 n 折 交 又 验证 的 极端 例子 ， 其 中 n 被 设置 为 数据 集中 物品 的 数量 。 因 此 ， 
算法 运行 许多 次 而 每 次 数据 点 只 使 用 其 中 一 个 作为 测试 。 我 们 需要 注意 的 是 ， 正 如 Isaks- 
son 等 讨论 的 那样 L44]， 除 非 数 据 集 足 够 大 ， 否 则 交叉 验证 可 能 不 可 信 。 

在 推荐 系统 中 常用 的 方法 是 从 用 户 中 抽取 可 用 的 反馈 以 用 户 评分 的 形式 来 划分 训练 和 
测试 。 交 又 验 证 的 方法 同样 也 很 常见 。 尽 管 在 一 般 的 案例 中 标准 随机 抽样 是 可 接受 的 , 但 = 
是 在 其 他 场景 中 我 们 需要 用 不 同 的 方法 定向 调整 抽样 出 来 的 测试 集 。 例 如 ， 我 们 可 能 决定 
只 抽样 最 近 的 评分 数据 ， 因 为 这 些 是 现实 情况 下 我 们 需要 预测 的 。 我 们 可 能 还 有 兴趣 确保 
每 个 用 户 的 评分 比例 被 保存 在 测试 集 ， 因 此 需要 对 每 一 个 用 户 使 用 随机 抽样 。 然 而 ， 所 有 
这 些 涉及 评估 推荐 的 问题 仍 是 一 个 探讨 和 研究 点 。 


2.2.3 降 维 


推荐 系统 中 不 仅 有 定义 高 维 空间 特征 的 数据 集 ， 而 且 在 空间 中 信息 非常 稀 朴 ， 例 如 ， 
每 个 对 象 就 那么 几 个 有 限 的 特征 有 值 。 密 度 ， 以 及 点 之 间 的 距离 ， 这 些 对 于 聚 类 和 孤立 点 
检测 非常 重要 ， 但 在 高 维 空间 中 的 意义 并 不 大 。 这 就 是 著名 的 维度 灾难 。 降 维 技术 通过 把 
原始 高 维 空间 转化 成 低 维 有 助 于 克服 这 类 问题 。 l 

稀疏 和 维度 灾难 是 推荐 系统 中 反复 出 现 的 问题 。 即 使 在 最 简单 的 背景 下 ， 我 们 很 可 能 
都 会 有 成 千 上 万 行 的 行 和 列 稀疏 矩阵 ， 其 中 大 部 分 值 是 零 。 因 此 ， 降 低 维度 就 自然 而 然 
了 。 应 用 降 维 技术 带 来 这 样 的 结果 ， 其 也 可 以 直接 适用 于 计算 推荐 的 预测 值 ， 即 它 可 以 作 
为 推荐 系统 设计 的 方法 ， 而 不 仅 是 数据 预 处 理 技术 。 

接 下 来 ， 我 们 概述 两 个 在 推荐 系统 中 最 相关 的 降 维 算法 : 主 成 分 分 析 (PCA) 和 奇异 值 
分 解 (SVD) 。 这 些 技术 可 以 单独 作为 推荐 方法 使 用 ， 或 作为 在 本 章 提 到 的 其 他 任何 技术 的 
预 处 理 步 又 。 
2.2.3.1 主 成 分 分 析 

主 成 分 分 析 (PCA)[45] 是 一 种 经 典 统计 方法 ， 用 来 发 现 高 维 数据 集中 的 模式 。 主 成 分 
分 析 可 以 获得 一 组 有 序 的 成 分 列表 ， 其 根据 最 小 平方 误差 计算 出 变化 最 大 的 值 。 列 表 中 第 
一 个 成 分 所 代表 的 变化 量 要 比 第 二 个 成 分 所 代表 的 变化 量 大 ， 以 此 类 推 。 我 们 可 以 通过 忽 
略 这 些 对 变化 贡献 较 小 的 成 分 来 降低 维度 。 

图 2. 2 显示 了 通过 高 斯 合并 产生 的 二 维 点 云 中 的 PCA 分 析 结 果 。 数 据 集中 之 后 ， 主 
要 成 分 由 u 和 ze 来 表示 。 考 虑 到 新 坐标 轴 的 长 度 所 涉及 的 能 量 被 包含 在 它们 的 特征 向 量 
中 。 因 此 ， 对 于 图 2.2 中 列举 的 特殊 例子 ， 第 一 个 成 分 wu 占 能 量 的 83. 5%， 这 意味 着 移 
除 第 二 个 成 分 us 将 只 失去 16. 5% 的 信息 。 根 据 经 验 规则 选择 m' 以 便于 累计 能 量 超过 一 定 
的 阐 值 ， 一 般 是 9096. PCA 允许 我 们 把 数据 投影 到 新 的 坐标 系 中 来 重新 表示 原始 数据 矩 
BE. X122 — X, W'mXm', BABE ARE X' 降 低 了 m 一 m' 维 度 并 保证 包含 大 部 分 的 原始 
数据 X 的 信息 。 

PCA 是 一 种 强大 的 技术 ， 但 也 有 重要 的 限制 。PCA 依赖 于 以 线性 合并 为 基础 的 经 验 
数据 集 ， 尽 管 一 般 的 非 线 性 PCA 方法 已 经 提出 。PCA 的 另 一 个 重要 假设 是 原始 数据 集 是 
从 高 斯 分 布 中 抽取 出 来 的 。 当 这 个 假设 不 正确 时 ， 就 无 法 保证 主要 成 分 的 有 效 性 。 

尽管 目前 的 趋势 似乎 表明 其 他 的 矩阵 分 解 技术 更 受 欢迎 ， 如 SVD 或 者 非 负 和 矩阵 分 解 ， 
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但 是 早期 用 得 最 多 还 是 PCA. Goldberg 等 在 在 线 笑话 推荐 的 内 容 中 提出 使 用 PCA 方法 
[37]。 他 们 的 系统 ， 著 名 的 Eigentaste， 开 始 于 标准 的 用 户 评分 矩阵 。 然 后 从 所 有 用 户 都 
评分 过 的 item 里 选 出 一 个 子 集 作 为 测试 集 。 这 个 新 矩阵 被 用 来 计算 全 局 相关 和 矩阵， 这 些 
矩阵 使 用 了 标准 的 二 维 PCA, 





图 2.2 PCA 基于 高 斯 合并 的 二 维 点 云 。 使 用 PCA 得 到 的 主 成 分 是 ww 和 ze， 
其 长 度 与 到 包含 在 所 有 成 分 的 能 量 相关 


2.2.8.2 奇异 值 分 解 


奇异 值 分 解 L[38] 是 一 个 强大 的 降 维 工具 。 它 是 矩阵 分 解 方法 的 特殊 实现 ， 因 此 它 也 和 
PCA 相关 。 在 SVD 分 解 中 的 关键 问题 是 发 现 低 维特 征 空间 ， 这 些 新 特征 代表 概念 以 及 在 
集合 内 容 中 的 每 一 个 概念 强度 都 是 可 计算 的 。 因 为 SVD 可 以 自动 获取 到 低 维 空间 上 的 语 
义 概念 ， 它 可 以 被 用 来 当 作 潜在 语义 分 析 的 基础 ， 潜 在 语义 分 析 [24j] 是 一 种 在 信息 检索 中 
非常 受 欢迎 的 文本 分 类 技术 。 

SVD 的 核心 算法 基于 以 下 的 理论 : 把 矩阵 A 分 解 成 A 二 UAV” 是 可 行 的 。 给 出 nXm 
和 矩阵 的 数据 A(n 个 物品 ，m 个 特征 )， 我 们 可 以 获得 一 个 nXr 的 矩阵 Un 个 物品 ，r 个 概 
a), 一 个 rrXr 的 对 角 和 矩阵 R( 概 念 的 长 度 )， 以 及 mXr 的 矩阵 VC(m 特征 ，r 概念 )。 
图 2. 3 阐述 了 这 个 想法 。R 的 对 角 和 矩阵 包含 奇异 值 ， 其 总 是 为 正 并 且 是 降序 排列 。U 矩阵 
可 以 解释 成 物品 概念 相似 矩阵 ， 和 矩阵 V 是 特征 概念 相似 性 矩阵 。 


m r 
(特征 ) (概念 
- S OMD 


= d ( ) 
(物品 ) x (物品 ) FRE Emel s 


图 2.3 阐述 了 最 基本 的 SVD. yh CE HEE RT DA 4) MER SR IL MR A 
物品 X 概 念 、 概 念 强度 、 概 念 X 特 征 
为 了 计算 矩形 矩阵 A 的 SVD， 我 们 考虑 如 下 公式 AAT MATA, U 的 列 是 AAT 的 特 
征 向 量 ，V 的 列 是 A7A 的 特征 向 量 。 和 矩阵 对 角 线 上 的 奇异 值 是 AAr 和 ATA 非 零 特 征 值 
的 平方 根 。 因 此 ， 为 了 计算 矩阵 A 的 SVD， 首 先 计 算 AAT(CT) 以 及 ATA(GD)， 然 后 计算 个 
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和 的 特征 向 量 和 特征 值 。 

在 4 中 的 特征 值 r 是 有 序 递减 的 。 因 此 ， 初 始 矩 阵 A 可 以 通过 截取 前 & 个 特征 值 来 近 
似 构 造 。 截 取 的 SVD 构造 了 一 个 近似 矩阵 A 的 & PRERE Ak —URARVT ,. A, 是 最 近似 原始 
和 矩阵 的 天 秩 矩 阵 。 最 近似 表达 的 是 最 小 化 A 5 A, 元 素 之 间 的 平方 差 之 和 。 被 截取 的 
SVD 代表 降 维 成 维 空间 后 的 潜在 结构 ， 这 一 般 意 味 着 特征 向 量 中 的 噪声 被 降低 。 

使 用 SVD 作为 工具 来 提高 协同 过 滤 已 经 有 一 段 时 间 了 。Sarwar 等 [66] 在 论文 中 描述 
了 使 用 SVD 的 两 种 不 同方 法 。 首 先 ，SVD 可 以 用 来 发 现 用 户 与 产品 之 间 的 潜在 关系 。 为 
了 完成 这 个 目的 ， 他 们 首先 用 物品 平均 评分 值 去 填充 用 户 -物品 矩阵 的 0 值 项 ， 然 后 通过 
减 去 用 户 对 所 有 物品 平均 评分 来 正规 化 这 些 矩 阵 。 这 些 矩 阵 用 SVD 来 分 解 ， 其 分 解 结果 
在 一 些 细 微 的 操作 之 后 可 以 直接 用 来 计算 预测 值 。 其 他 方法 是 使 用 从 SVD 中 提取 出 的 低 
维 空间 中 的 结果 来 提高 在 kNN 方法 的 邻居 信息 。 

正如 Sarwar 等 [65] 描 述 的 那样 ，SVD 的 一 大 优势 是 有 增 量 算法 来 计算 近似 的 分 解 。 
这 使 得 我 们 在 接收 到 新 用 户 或 者 是 评分 的 时 候 ， 没 有 必要 重新 计算 用 先前 存在 的 数据 构建 
的 模型 。 同 样 的 想法 后 来 被 Brand[14] 的 在 线 SVD 模型 扩充 和 正式 采纳 。 在 成 功 应 用 到 
Netflix Prize 之 后 ， 增 量 SVD 方法 的 使 用 最 近 已 经 成 为 常用 的 方法 。Simon Funk 的 简单 
增 量 SVD 方法 的 发 表 被 标志 为 竞赛 中 的 转折 点 [35j]。 自 从 它 发 表 之 后 ， 在 该 领域 已 经 发 
表 了 几 篇 改进 的 SVD( 详 细 信息 可 以 参考 Paterek 的 全 部 SVD 的 算法 [56]， 或 者 是 Kurucz 
等 的 SVD 参数 评估 [47]) 。 

最 后 ， 应 该 注意 的 是 矩阵 分 解 C(MF) 的 不 同 变化 方法 ， 如 非 负 的 矩阵 分 解 C(NNMF) 已 
经 被 使 用 [74]。 本 质 上 来 说 ， 这 些 算法 类 似 于 SVD。 最 基本 的 想法 是 把 评分 矩阵 分 解 成 两 
个 部 分 : 一 个 部 分 包含 描述 用 户 的 特征 ， 另 一 个 部 分 包含 描述 物品 的 特征 。 和 矩阵 分 解 通过 
引入 偏 项 到 模型 中 来 处 理 缺 失 数据 比 SVD 方法 要 好 。 但 是 ，SVD 方法 中 也 可 以 在 预 处 理 
阶段 通过 用 物品 的 平均 值 来 取代 零 值 来 处 理 。 需 要 注意 的 是 SVD 和 MF 都 可 能 产生 过 拟 
合 的 问题 。 但 是 已 存在 改进 的 MF， 如 正规 化 内 核 矩 阵 分 解 ， 能 有 效 地 避免 这 个 问题 。 
MF 和 SVD 方法 的 主要 问题 是 ， 由 于 计算 的 复杂 性 每 次 数据 升级 更 新 时 重新 计算 分 解 是 
不 现实 的 。 但 是 ，Rendle 和 Schmidt-Thieme[L62j] 提 出 一 种 在 线 的 方法 允许 不 用 重新 计算 
所 有 整个 模型 来 更 新 分 解 近似 值 。 

第 5 章 会 详细 介绍 在 Netflix Prize 的 环境 中 SVD 和 MF 的 使 用 ， 是 对 本 章 简介 的 详 
细 补 充 。 


2.2.4 AR 


数据 挖掘 中 采集 的 数据 可 能 会 有 各 种 噪声 ， 如 缺失 数据 ， 或 者 是 异常 数据 。 去 噪 是 非 
常 重要 的 预 处 理 步 又， 其 目的 是 在 最 大 化 信息 量 时 去 除 掉 不 必要 的 影响 。 

在 一 般 意义 上 我 们 把 噪声 定义 为 在 数据 收集 阶段 收集 到 的 一 些 可 能 影响 数据 分 析 和 解 
释 结果 的 伪造 数据 。 在 推荐 系统 的 环境 中 ， 我 们 区 分 自然 的 和 恶意 的 噪声 [55]。 前 者 提 到 
的 噪声 是 用 户 在 选择 偏好 反馈 时 无 意 产生 的 。 后 者 是 为 了 偏离 结果 在 系统 中 故意 引 和 人 的 。 

很 显然 恶意 的 噪声 能 够 影响 推荐 的 输出 。 但 是 ， 我 们 的 研究 推断 正常 的 噪声 对 推荐 系 
统 性 能 的 影响 是 不 可 忽略 的 [4]。 为 了 解决 这 个 问题 ， 我 们 设计 了 一 个 去 噪 方法 ， 能 够 通 
过 要 求 用 户 重新 评价 一 些 物品 来 提高 精确 度 L5]。 我 们 推断 通过 预 处 理 步骤 来 提高 精确 度 
能 够 比 复杂 的 算法 优化 效果 要 好 得 多 。 
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2.3 分 类 


分 类 器 是 从 特征 空间 到 标签 空间 的 映射 ， 其 中 特征 代表 需要 分 类 的 元 素 的 属性 ， 标 签 
代表 类 别 。 例 如 ， 和 餐厅 推荐 系统 能 够 通过 分 类 器 来 实现 ， 其 分 类 器 基于 许多 特征 描述 把 餐 
厅 分 成 两 类 中 的 一 类 (好 的 ， 不 好 的 ) 。 

有 许多 种 类 型 的 分 类 器 ， 但 是 一 般 情 况 下 我 们 谈 的 有 监督 分 类 器 和 无 监督 分 类 器 。 在 
有 监督 分 类 器 中 ， 我 们 预先 知道 一 组 标签 或 是 类 别 ， 并 且 我 们 有 一 组 带 有 标签 的 数据 ， 用 
来 组 成 训练 集 。 在 无 监督 分 类 中 ， 类 别 都 是 提前 未 知 的 ， 其 任务 是 恰当 地 组 织 好 我 们 手中 
的 元 素 ( 按 照 一 些 规则 ) 。 在 本 节 中 我 们 描述 几 个 算法 来 学 习 有 监督 分 类 ， 无 监督 分 类 (如 
聚 类 ) 将 在 2. 4 节 中 进行 描述 。 


2.3.1 最 近邻 


基于 样本 的 分 类 (instance-based classifier) 通 过 存储 训练 记录 并 使 用 它们 来 预测 未 知 样 
本 的 标签 类 别 。 一 个 常见 的 例子 是 所 谓 的 死记 硬 背 学 习 (rote-learner) 。 这 种 分 类 器 记 住 了 
所 有 的 训练 集 ， 并 且 只 有 在 新 记录 的 属性 与 训练 集中 样本 完全 匹配 时 才 会 分 类 。 一 个 更 加 
精确 和 通用 的 基于 样本 的 分 类 是 近邻 分 类 (kNN) 。 给 出 一 个 要 分 类 的 点 ，kNN 分 类 器 能 
够 从 训练 记录 中 发 现 个 最 近 的 点 。 然 后 按照 它 最 近邻 的 类 标签 来 确定 所 属 类 标签 。 算 法 
的 基本 思想 是 ， 如 果 一 个 样本 落 人 由 一 个 类 标签 主导 的 领域 ， 是 因为 这 个 样本 可 能 属于 这 
^23. 

假设 我 们 需要 确定 样本 q 的 类 别 !， 定 义 训练 集 是 x— (ns hjer BH r 是 
第 7 个 元 素 ，/ 是 它 的 类 标签 ，& 的 最 近邻 可 以 找到 子 集 Y=({({(y ，4)》…(y)}}， 使 得 YE 
X H£Xhid(q, ÆRTER. Y 包含 X 中 的 & 个 离 g 最 近 的 样本 点 。 那 么 ，9 的 类 标签 是 
lL=f( {hehe 

也 许 在 kNN 中 最 具有 挑战 的 问题 是 如 何 选择 E WR RA), DRA RE X RE 
点 太 敏 感 。 但 是 如 果 & 太 大 ， 近 邻 范围 可 能 会 包含 其 他 类 中 太 多 的 点 。 图 2. 4 右 图 展示 了 
不 同 的 & 值 下 最 终 确定 不 同 的 类 标签 。k 二 1 时 类 标签 可 能 是 圆 形 的 ， 而 二 7 时 类 标签 是 
正方 形 。 注 意 到 例子 中 的 查询 点 正好 处 于 两 个 类 别 中 的 边界 上 ， 因 此 ， 分 类 很 困难 。 





o items of cluster 1 o items of cluster 1 


2 || "items of cluster 2 | ^ 2 ||; items of cluster 2 |o 
^ item to classify O o 
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sitem to classify 
a 


-2 





-3 -3 
3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 


图 2.4 & 近 邻 的 例子 。 左 边 的 子 图 显示 带 有 两 个 类 标签 的 训练 点 ( 圆 形 和 正方 形 ) 和 查询 点 (三 角形 )。 
右边 的 子 图 阐述 4 一 1 和 At 一 7 时 的 最 近邻 。 查 询 点 按照 简单 多 数 规则 ， 当 一 1 时 被 分 类 为 正方 

形 ， 当 二 5 时 被 分 类 为 圆 形 。 注 意 查询 点 正好 在 两 个 类 别 之 间 的 边界 线 上 
KNN 分 类 器 在 所 有 的 机 器 学 习 的 算法 中 是 最 简单 的 。 因 为 kNN 不 要 建立 一 个 显示 的 
模型 ， 所 以 被 认为 是 一 个 懒 的 学 习 者 。 不 像 饥 饿 学 习 者 ， 如 决策 树 或 是 基于 规则 的 系统 
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(分 别 参 见 2.3.2 节 和 2.3.3 节 )，kNN 分 类 器 把 许多 的 决策 留 给 了 分 类 的 步骤 。 因 此 ， 
分 类 未 知 记录 的 花费 相当 大 。 

近邻 算法 是 CF 最 常用 的 一 种 方法 ， 因 而 被 用 来 设计 推荐 系统 。 事 实 上 ， 任 何 的 推荐 
系统 综述 ， 如 Adomavicius 和 Tuzhilin 的 那 篇 L1]， 都 会 包含 本 书 所 提 到 的 近邻 使 用 的 简 
介 。 这 种 分 类 的 优点 之 一 是 它 的 概念 和 CF 很 相关 : 发 现 志趣 相投 的 用 户 ( 或 者 是 类 似 的 物 
品 ) 实 质 上 等 价 于 发 现 给 定 用 户 或 者 是 物品 的 邻居 。 其 他 的 优势 是 : 作为 kNN 分 类 器 这 样 
一 个 懒惰 学 习 者 ， 它 不 需要 学 习 和 维持 一 个 给 定 的 模型 。 因 此 ， 在 原则 上 ， 系 统 能 够 适应 
用 户 评 分 和 矩阵 的 急速 变化 。 遗 憾 的 是 ， 这 是 以 重新 计算 邻居 和 相似 矩阵 为 代价 的 。 这 也 是 
我 们 要 提出 一 种 用 精简 后 的 专家 集合 来 挑选 邻居 模型 的 原因 [3]。 

尽管 kNN 方法 简单 和 直观 ,但 是 它 的 结果 精确 ， 非 常 易于 提升 。 事 实 上 ， 它 对 于 协 
同 推荐 的 实际 标准 的 主导 地 位 最 近 才 被 基于 降 维 的 方法 所 挑战 ， 如 2.2.3 节 所 叙述 的 。 也 
就 说 ， 针 对 协同 过 滤 方 法 的 传统 的 kNN 方法 已 经 在 几 个 方向 上 得 到 了 提升 。 例 如 ， 在 
Netflix Prize 的 实验 环境 中 ，Bell 和 Koren 建议 一 种 方法 来 移 除 全 局 的 影响 ， 如 一 些 物 品 
可 能 会 吸引 用 户 一 致 给 低 分 。 他 们 提出 邻居 建立 时 立即 计算 插入 权 值 的 优化 算法 。 

详 见 第 5 章 和 第 4 章 基 于 邻居 使 用 改进 CF 技术 的 更 多 细节 。 


2.3.2 RRR 


决策 树 [61，63] 是 以 树 结构 形式 对 目标 属性 (或 类 ) 进 行 分 类 的 分 类 器 。 要 分 类 的 观察 
数据 (或 物品 ) 是 由 属性 及 其 目标 值 组 成 的 。 树 的 节点 可 以 是 : a) 决 策 节 点 ， 在 这 些 节点 中 
一 个 简单 属性 值 被 测试 来 决定 应 用 哪 一 个 子 树 ; b) 叶 子 节 点 指示 目标 属性 的 值 。 

对 于 决策 树 归纳 有 许多 的 算法 : 最 常 提 到 的 是 搜索 算法 ,包括 CART、ID3、C4. 5、 
SLIQ, SPRINT. 递归 搜索 算法 (最 早 的 也 是 最 容易 理解 的 算法 ) 依 赖 作用 于 给 定 属性 的 测 
试 条 件 ， 通 过 它们 的 目标 值 来 区 别 这 些 观 察 值 。 算 法 一 旦 找到 测试 条 件 推导 出 的 划分 区 
域 ， 就 会 反复 迭代 ， 直 到 划分 区 域 为 空 ， 或 者 观察 数据 都 有 相同 的 目标 值 。 

拆 分 可 以 通过 最 大 的 信息 增益 来 决定 ， 定 义 如 下 : | 


k. 
i 


A; = I(parent) 一 >) Novia) (2. 6) 


j=1 


Ep, k 是 属性 i 的 值 ，N 是 观察 数据 的 数量 ，w 是 根据 属性 i 的 值得 到 的 观察 值 的 
第 7 个 划分 。 最 后 ，1 是 衡量 不 纯 节点 的 函数 。 有 各 种 不 同 的 不 纯 衡 量 方法 ， 基 尼 指 数 、 
炳 、 误 分 类 误差 是 在 文献 中 最 常用 的 。 

一 旦 所 有 的 观察 值 属于 同一 个 类 (或 者 是 在 连续 属性 中 的 相同 范围 )， 决 策 树 的 推导 就 
结束 。 这 表明 叶子 节点 的 非 纯度 是 零 。 然 而 ， 因 为 实际 的 原因 ， 大 部 分 的 决策 树 通 过 剪 术 
技术 实现 ， 如 果 节 点 的 非 纯度 或 者 观察 值 的 数量 低 于 某 个 阔 值 ， 节 点 不 再 进行 分 裂 。 

使 用 决策 树 建 立 一 个 分 类 器 的 主要 优点 是 ， 构 建 代价 比较 小 并 且 在 分 类 未 知 的 对 象 方 
面 速度 比较 快 。 与 其 他 基础 的 分 类 技术 相 比 ， 决 策 树 另 一 个 好 的 方面 是 在 维持 精度 的 同 
时 ， 它 产生 的 一 系列 规则 容易 被 解释 ( 见 2. 3. 3 节 ) 。 

推荐 系统 中 的 决策 树 可 以 用 在 基于 模型 的 方法 里 。 一 种 可 能 是 用 内 容 特征 建立 决策 树 
模型 ， 对 描述 用 户 偏好 的 所 有 变量 建 模 。Bouza 等 [12] 利 用 这 种 想法 ， 使 用 物品 可 用 的 语 
义 信息 构建 一 个 决策 树 。 用 户 只 评价 两 个 物品 之 后 就 能 构造 决策 树 。 每 个 物品 的 特征 被 用 
来 建立 一 个 解释 用 户 评分 的 模型 。 他 们 使 用 每 一 个 特征 的 信息 增益 作为 分 裂 准则 。 需 要 注 
意 的 是 ， 尽 管 这 种 方法 从 理论 视角 看 很 有 趣 ， 但 是 在 他 们 系统 上 报告 的 精确 性 比 推荐 平均 
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评分 的 方法 要 差 。 

正如 可 以 预料 到 的 那样 ， 建 立 一 个 试图 解释 决策 过 程 中 所 有 参数 的 决策 树 是 非常 困难 
以 及 不 现实 的 。 但 是 ， 决 策 树 可 以 被 用 来 模拟 系统 的 一 个 特殊 部 分 。 例 如 ，Cho 等 [8] 提 
出 一 个 结合 关联 规则 ( 见 2. 5 节 ) 和 决策 树 的 在 线 购物 推荐 系统 。 决 策 树 被 用 来 作为 一 个 过 
滤器 来 选择 哪些 用 户 可 以 作为 推荐 的 目标 。 为 了 建立 这 个 模型 ， 他 们 创建 了 一 个 候选 用 户 
集 ， 用 户 集 是 在 给 定 的 时 间 帧 内 从 一 个 给 定 的 目录 下 选 了 商品 的 这 些 用 户 。 在 他 们 的 案例 
中 ， 选 择 作为 构造 决策 树 的 因 变 量 是 用 户 是 否 会 在 相同 的 分 类 下 再 买 新 的 产品 。Nikovski 
和 Kulev[54] 随 后 提出 一 个 与 之 类 似 的 结合 决策 树 和 关联 规则 的 方法 。 在 他 们 的 方法 中 ， 
先是 在 购买 的 数据 集中 发 现 频 繁 物品 集 ， 然 后 应 用 标准 的 树 学 习 算 法 来 简化 推荐 规则 。 

在 推荐 系统 中 另 一 个 使 用 决策 树 的 选择 是 使 用 它们 作为 物品 排序 的 工具 。 使 用 决策 树 
来 排序 已 经 在 一 些 环境 下 被 研究 ， 而 且 很 明确 都 是 为 了 这 个 目的 L[7，17]。 


2.3.3 基于 规则 的 分 类 


基于 规则 分 类 器 是 通过 一 组 “if…then…? 的 规则 集合 划分 数据 。 规 则 的 前 提 或 条 件 是 
属性 连词 的 表达 式 。 规 则 的 结论 是 一 个 正 或 者 负 的 分 类 。 

如 果 对 象 的 属性 满足 规则 的 条 件 ， 可 以 说 规则 R 覆盖 对 象 z。 我 们 定义 规则 的 覆盖 性 
为 满足 前 提 的 部 分 记录 。 另 一 方面 ， 我 们 定义 准确 性 为 既 满 足 前 提 又 满足 结论 的 部 分 记 
录 。 如 果 规 则 彼此 之 间 是 独立 的 ， 我 们 说 分 类 器 包含 互 斥 的 规则 ， 例 如 ， 每 一 个 记录 最 多 
被 一 个 规则 覆盖 。 最 后 ， 如 果 属 性 值 的 所 有 可 能 组 合 都 被 覆盖 ， 例 如 ， 一 个 记录 至 少 被 一 
个 规则 覆盖 ， 则 认为 分 类 器 具有 详尽 规则 (exhausitive rules), | 

为 了 建立 一 个 基于 规则 的 分 类 器 ， 我 们 可 以 用 从 数据 中 直接 抽取 规则 的 直接 方法 。 这 
种 方法 的 例子 是 RIPPER 或 CN2。 男 一 方面 ， 使 用 间接 的 方法 从 其 他 分 类 模型 中 抽取 规则 
很 常见 ， 例 如 ， 决 策 树 模型 或 神经 模型 。 

基于 规则 分 类 器 的 优点 是 它们 表示 很 明确 ， 因 为 它们 是 符号 化 的 并 且 可 以 在 没有 任何 
转化 的 情况 下 操作 数据 的 属性 。 基 于 规则 的 分 类 器 ， 由 决策 树 扩 充 ， 容 易 解 释 ， 容 易 生 
成 ， 并 且 它 们 能 有 效 地 分 类 新 的 对 象 。 

但 是 ， 与 决策 树 方法 类 似 ， 建 立 一 个 完整 基于 规则 的 推荐 模型 是 很 难 的 。 事 实 上 ， 这 
种 方法 在 推荐 的 环境 中 不 是 很 流行 ， 因 为 得 到 一 个 基于 规则 的 系统 意味 着 我 们 要 么 具有 一 
些 决 策 过 程 中 的 显 式 的 先 验 知识 ， 要 么 从 另 一 个 模型 中 提取 规则 ， 如 决策 树 。 但 是 基于 规 
则 的 系统 通过 注 人 一 些 领域 知识 或 商业 规则 来 提高 推荐 系统 的 性 能 。 例 如 ，Anderson 等 
[6] 实 现 了 一 个 协同 音乐 推荐 系统 ， 这 个 系统 通过 应 用 一 个 基于 规则 的 系统 在 协同 过 滤 的 
结果 中 提高 性 能 。 如 果 用 户 给 某 个 音乐 家 的 专辑 评分 很 高 ， 那 么 这 个 音乐 家 的 其 他 专辑 的 
预测 评分 也 会 提高 。 

Gutta 等 [29] 实 现 了 一 个 关于 电视 内 容 的 基于 规则 的 推荐 系统 。 为 此 ， 他 们 首先 使 用 
C4. 5 决策 树 ， 然 后 分 解 成 规则 来 分 类 电视 节目 。Basu 等 [9] 利 用 归纳 的 方法 使 用 Ripper 
[20] 系 统 从 数据 中 学 习 规 则 。 在 他 们 的 报告 中 ， 使 用 混合 内 容 和 协同 数据 来 学 习 规 则 的 结 
果 明 显 好 于 单纯 的 CF 方法 。 


2.3.4 贝 叶 斯 分 类 器 
贝 叶 斯 分 类 器 [34] 是 解决 分 类 问题 的 一 个 概率 框架 。 它 基于 条 件 概率 定义 和 贝 叶 斯 理 
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论 。 贝 叶 斯 统计 学 派 使 用 概率 来 代表 从 数据 中 学 习 到 的 关系 的 不 确定 性 。 此 外 ， 先 验 的 概 
念 非常 重要 ， 因 为 它们 代表 了 我 们 的 期 望 值 ， 或 者 真正 关系 可 能 是 什么 的 先 验 知识 。 特 别 
的 是 ， 给 定数 据 后 ， 模 型 的 概率 (后 验 概 率 ) 是 和 似 然 值 乘 以 先 验 概 率 的 乘积 成 比例 的 。 似 
sem L r m ih iue 


pu Us qe fiiia 性 和 类 标签 当 作 随机 变量 (连续 或 者 离散 ) 。 一 个 带 有 六 个 
属性 的 记录 (Al， Ut, Ay), 目标 是 预 测 类 C, , Jr ik EY 全 定数 据 PA Ars t. 
An) F, PaO COE C b 应 用 贝 叶 斯 理论 PCC, |A, Ars s+ An) 
ccP(A , Ap» **, An |C) PCG). 


FN (EAB EF AS DOE HERI ETUR BOLT HOHER. PC, 
A:，…，An 1C:)。 假 设 属性 的 概率 独立 ， 比 如 ， 一 个 特殊 属性 的 存在 与 否 和 其 他 任何 的 属 
性 的 存在 与 否 没 有 关系 。 这 种 假设 导致 P(A, , Az, Ut, An 1C — P(A, |C,) PCA, | Ce ) … 
P(An |C,). 

朴素 贝 叶 斯 的 主要 好 处 是 ， 受 孤立 噪声 点 和 不 相关 的 属性 的 影响 小 ， 并 且 在 概率 估算 
期 间 可 以 通过 忽略 实例 来 处 理 缺 失 值 。 但 是 ， 独 立 性 假设 对 一 些 相互 关联 的 属性 来 说 可 能 
不 成 立 。 在 这 种 情况 下 ， 通 常 的 方法 是 使 用 所 谓 的 贝 叶 斯 信念 网 络 ( 或 简称 贝 叶 斯 网 络 ) 。 
BBN 使 用 非 循环 图 表示 属性 之 间 的 依赖 性 ， 并 使 用 概率 表 表 示 节 点 与 直接 父亲 之 间 的 联 
系 。 与 朴素 贝 叶 斯 分 类 器 方法 类 似 ，BBN 可 以 很 好 地 处 理 不 完整 的 数据 ， 对 于 模型 的 过 
拟 合 有 相当 的 健壮 性 。 

贝 叶 斯 分 类 器 在 基于 模型 的 推荐 系统 中 特别 受 欢 迎 。 它 们 经 常 被 用 来 为 基于 内 容 的 推 
荐 生成 模型 。 当 然 ， 它 们 也 被 用 于 协同 环境 中 。 例 如 ，Ghani 和 FanoL36]j， 使 用 朴素 贝 叶 
斯 实现 了 一 个 基于 内 容 的 推荐 系统 。 使 用 这 个 模型 允许 在 百货 商店 环境 中 从 不 相关 的 目录 
中 推荐 产品 。 

Miyahara 和 Pazzani[ 52] 实 现 了 一 个 基于 朴素 贝 叶 斯 分 类 器 的 推荐 系统 。 为 了 达到 这 
个 目的 定义 了 两 个 类 : 喜欢 和 不 喜欢 。 在 这 种 的 环境 中 他 们 提出 两 个 方法 来 使 用 朴素 贝 叶 
斯 分 类 器 : 数据 转化 模型 假设 所 有 的 特征 都 是 完全 独立 的 ， 特 征 选 择 作为 一 个 预 处理 步 又 
来 实施 。 另 一 方面 ， 稀 朴 数据 模型 假设 只 有 已 知 的 特征 是 对 分 类 有 益 的 信息 。 此 外 ， 当 佑 
算 概率 的 时 候 ， 只 使 用 用 户 都 共同 评价 的 数据 。 实 验 显 示 两 种 模型 性 能 好 于 基于 相关 性 
的 CF. 

Pronk 等 [58] 用 贝 叶 斯 朴素 聚 类 器 作为 基础 来 合并 用 户 组 件 并 且 提 高 性 能 ， 特 别 是 冷 
启动 环境 。 为 了 做 到 这 一 点 ， 他 们 提出 给 每 个 用 户 维持 两 个 属性 文件 ， 一 个 从 历史 评分 中 
学 习 得 到 ， 另 一 个 由 用 户 显 式 地 创建 。 两 种 分 类 器 的 混合 可 以 通过 这 样 的 方式 来 控制 ， 在 
早期 阶段 没有 太 多 历史 评分 时 采用 用 户 定义 属性 文件 ， 然 后 在 随后 的 阶段 再 用 学 习 型 分 类 
器 取而代之 。 

在 2.3.3 节 中 我 们 提 到 Gutta 等 [29] 在 电视 内 容 上 实现 了 一 个 基于 规则 方法 的 推荐 系 
统 。 此 外 他 们 还 实验 了 贝 叶 斯 分 类 器 。 首 先 定义 一 个 两 类 分 类 器 ， 类 别 包括 : 看 过 和 没 看 
过 。 用 户 配 置 文件 是 属性 的 集合 ， 以 及 他 们 作为 正 样本 和 负 样 本 出 现 的 次 数 。 这 会 被 用 来 
计算 节目 属于 某 个 特定 分 类 的 先 验 概率 ， 以 及 当 节 目 是 正 向 或 负 向 时 ， 某 个 给 定 特 征 会 出 
现 的 条 件 概率 。 在 这 样 案例 中 ， 人 新 节 
目的 后 验 概率 是 从 这 些 ( 环 境 和 内 容 ) 中 计算 得 来 的 。 

Breese 等 [15] 实 现 了 将 每 个 节点 关联 到 每 个 物品 的 贝 叶 斯 网 络 。 状 态 与 每 个 可 能 的 投 
票 值 相关 。 在 网 络 中 ， 每 一 个 物品 将 有 一 组 父亲 节点 作为 它 最 好 的 预测 器 。 条 件 概率 表 被 
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决策 树 取 代 。 作 者 报告 显示 在 几 组 数据 集 上 这 种 模型 的 结果 比 几 种 近邻 算法 的 结果 要 好 。 

分 层 的 贝 叶 斯 网 络 也 用 在 一 些 环境 中 ， 用 作 信 息 过 滤 添 加 领域 知识 的 方法 [78]。 但 是 
分 层 的 贝 叶 斯 网 络 的 问题 之 一 是 ， 当 其 中 的 用 户 过 多 时 ， 学 习 和 升级 模型 的 代价 非常 大 。 
Zhang 和 Koren[79] 提 出 一 个 标准 期 望 最 大 化 模型 的 变种 ， 能 够 在 基于 内 容 推荐 系统 中 的 
环境 中 加 速 这 种 过 程 。 


2.3.5 人 工 神经 网 络 


人 工 神经 网 络 (ANN)[81] 由 一 组 内 连接 点 和 带 权 链接 组 成 ， 其 想法 来 自 于 生物 大 脑 
的 结构 。ANN 中 的 节点 称 为 神经 元 ， 类 似 于 生物 神经 。 这 些 简 单 的 功能 单元 组 成 网 络 ， 
网 络 在 用 有 效 数 据 训 练 之 后 能 够 学 习 分 类 问题 。 

ANN 的 最 简单 模型 是 感知 器 模型 ， 如 图 2. 5 所 示 。 如 果 我 们 把 激活 函数 $ 特 指 为 简 
单 的 阔 值 函数 ， 则 输出 就 是 根据 每 条 链接 的 权重 将 输入 值 累 加 ， 然 后 和 某 个 阔 值 9 相 比 
较 。 输 出 函数 可 以 由 式 (2.7) 来 表达 。 感 知 模型 是 具有 简单 和 有 效 学 习 算法 的 线性 聚 类 器 。 
但 是 ， 除 了 使 用 在 感知 模型 中 的 阔 值 函数 ， 还 有 几 种 其 他 对 于 激活 函数 通用 的 选择 ， 如 多 
层 感知 机 、 正 切 双 曲 或 者 是 阶梯 函数 。 





图 2.5 感知 器 模型 


l, 若 盖 zi > O 
MEC | (2; 1 


0, BU rw <b 

ANN 可 以 有 许多 的 层 。 在 ANN 中 的 层 被 分 成 三 种 类 型 : 输入 、 隐 藏 、 输 出 。 输 入 
层 的 单元 响应 进入 网 络 的 数据 。 隐 藏 层 接 受 从 输入 单元 中 的 带 权 输出 。 输 出 层 响 应 隐藏 层 
中 的 带 权 输出 并 且 产生 最 终 的 网 络 输出 。 使 用 神经 元 作为 原子 功能 单元 ， 在 网 络 中 有 许多 
种 可 能 的 架构 来 把 它们 结合 在 一 起 。 但 是 ， 最 常用 的 方法 是 使 用 前 馈 ANN。 在 这 个 例子 
中 ， 信 和 号 严格 在 一 个 方向 传播 : 从 输入 到 输出 。 

ANN 最 主要 的 优点 是 (取决 于 激活 函数 ) 能 做 非 线性 的 分 类 任务 ， 并 且 由 于 并 行 属性 ， 
它们 高 效 甚至 能 够 在 部 分 网 络 受 损 的 情况 下 操作 。 主 要 的 缺点 是 ， 它 很 难 对 给 定 的 问题 提 
供 理想 的 网 络 拓扑 ， 并 且 一 旦 确定 拓扑 后 它 的 表现 水 平 就 会 位 于 分 类 错误 率 的 下 限 。 
ANN 属于 一 种 次 符号 分 类 器 ， 也 就 是 说 ， 在 推理 知识 的 时 候 不 提供 任何 语义 知识 ， 说 白 


第 2 章 ”推荐 系统 中 的 数据 挖 据 方 法 39. 


了 这 是 一 种 黑 盒 方法 。 

ANN 能 够 以 类 似 于 贝 叶 斯 网 络 的 方法 用 来 构建 基于 模型 的 推荐 系统 。 但 是 ， 没 有 
令 人 信服 的 研究 表明 ANN 是 否 会 提升 性 能 。 事 实 上 ，Pazzani 和 Billsus[57] 做 了 一 个 综 
合 实验 ， 使 用 几 种 机 器 学 习 算 法 进行 网 页 推荐 。 他 们 的 主要 目标 是 比较 朴素 贝 叶 斯 分 类 
器 与 计算 开销 更 大 的 候选 方法 ， 如 决策 树 和 神经 网 络 。 他 们 的 实验 结果 显示 决策 树 的 效 
果 明 显 不 好 。 他 们 推断 似乎 没有 必要 用 非 线性 分 类 器 ， 如 ANN. Berka 等 [31] 使 用 
ANN 为 网 页 导航 建立 URL 推荐 系统 。 他 们 实现 了 专门 基于 访问 路 径 而 与 内 容 无 关 的 系 
统 ， 比 如 ， 把 域名 和 访问 它们 的 人 数 关联 起 来 。 为 此 ， 他 们 使 用 了 后 向 传播 算法 训练 的 
前 馈 多 层 感 知 器 。 

ANN 可 以 被 用 来 结合 (或 是 混合 ) 几 个 推荐 模块 或 者 数据 源 中 的 输入 。 例 如 ，Hsu 等 
[30j] 建 立 一 个 电视 推荐 模型 ,通过 四 个 不 同 的 源 导入 数据 : 用 户 的 配置 文件 和 自身 看 法 、 
观看 社区 、 节 目 元 数据 、 观 看 环境 。 他 们 用 后 向 传播 算法 来 训练 三 层 神 经 网 络 。Christak- 
ou 和 Stafylopatis[19] 也 建立 了 一 个 混合 的 基于 内 容 的 协同 过 滤 推 荐 系统 。 基 于 内 容 的 推 
荐 系统 在 实现 时 对 每 个 用 户 采 用 了 三 种 神经 网 络 ， 其 中 每 一 个 对 应 如 下 的 一 个 特征 : 种 
类 、 星 级 、 摘 要 。 他 们 使 用 弹性 反 向 传播 方法 来 训练 ANN。 


2.3.6 支持 向 量 机 


支持 向 量 机 分 类 [234] 的 目标 是 发 现 数据 的 线性 超 平面 (决策 边界 )， 以 边界 最 大 化 的 方 
式 分 离 数 据 。 例 如 ， 如 果 我 们 在 二 维 平面 上 看 两 类 分 离 的 问题 ， 如 图 2.6 阐述 的 那样 ， 很 
容易 观察 到 分 成 两 个 类 有 许多 种 可 能 的 边界 线 。 每 一 个 边界 线 都 有 一 个 相关 的 边缘 。 
SVM 后 面 的 理论 支持 是 ， 如 果 我 们 选择 间隔 最 大 化 的 那 一 个 ， 将 来 对 未 知 的 物品 分 类 出 
错 的 可 能 性 就 越 小 。 


小 间隔 大 间隔 






| ^ h ie à 





全 A 
支持 向 量 
图 2.6 在 二 维 上 不 同 的 边界 决定 可 能 分 成 不 同 的 类 。 每 一 个 边界 有 一 个 相关 的 间隔 
两 个 类 中 的 线性 分 离 是 通过 函数 w， xz 十 b= 二 0 来 实现 的 。 我 们 定义 能 够 划分 物品 类 
十 1 或 一 1 的 函数 ， 只 要 这 些 物品 是 被 来 自 类 划分 函数 的 某 个 最 小 距离 分 开 的 。 式 (2. 8) 给 
出 了 相应 的 公式 。 
i.  Gwsrdbll 
一 1， #werxtd<l1 
TEE 
SUN = Taf 


根据 SVM 的 主要 原理 ， 我 们 想 要 最 大 化 两 个 类 之 间 的 间隔 ， 由 式 (2. 9) 给 出 。 事 实 上 


f(z) = (2. 8) 


(2. 9) 
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这 等 价 于 在 给 定 /(z) 的 约束 条 件 下 ， 最 小 化 L(w) 一 1 史上 的 倒数 。 这 其 实 是 带 约束 最 优 


化 的 问题 ， 有 许多 数学 方法 可 以 解决 它 ( 如 二 次 规划 ) 。 

如 果 物 品 不 是 线性 分 离 的 ， 则 可 以 通过 引入 一 个 松弛 变量 来 把 SVM 转变 为 软 间隔 分 
类 器 。 在 这 种 情况 下 ， 式 (2. 10) 的 最 小 化 受 限于 式 (2. 11) 新 的 f(x) 定义 。 另 一 方面 ， 如 
果 决 策 边界 是 非 线性 的 ， 我 们 需要 转换 数据 到 高 维 的 空间 。 这 个 转换 的 完成 得 益 于 名 为 内 
核 技巧 的 数学 变换 。 最 基本 的 想法 是 通过 内 核 函 数 取代 在 式 (2. 8) 中 的 点 积 。 对 于 内 核 函 
数 有 许多 不 同 的 可 行 的 选择 ， 比 如 多 项 式 或 多 层 感 知 器 。 但 是 最 常用 的 内 核 函 数 是 径 向 基 
函数 系列 (RBF) 。 


2 N 
L(w) = lelt c c3. (2. 10) 
i=l 


Ls 若 w。Xx 十 b 宇 1 一 € 

下 TARN 

支持 向 量 机 最 近 已 经 在 许多 的 环境 中 获得 较 好 的 性 能 和 效率 。 在 推荐 系统 里 ，SVM 

最 近 也 显示 出 了 显著 效果 。 比 如 ，Kang 和 Yoo[46] 报 告 了 一 个 实验 研究 ， 其 目的 在 于 为 

基于 SVM 的 推荐 系统 选择 最 好 的 预 处 理 技术 预测 缺失 值 。 他 们 特别 使 用 了 SVD 和 支持 向 

量 回 归 (SVR) 。 支 持 向 量 机 推荐 系统 首先 通过 二 进 制 化 可 用 用 户 偏 好 数据 的 80 个 等 级 来 

建立 。 他 们 设置 了 几 组 实验 ， 并 且 报 告 了 阅 值 为 32 时 的 最 好 结果 ， 例 如 ，32 和 更 小 的 值 

被 分 为 喜欢 ， 较 高 值 被 分 为 不 喜欢 。 用 户 的 ID 被 用 作 分 类 的 标签 ， 正 负 值 被 表达 成 偏好 
{Hi 152. 

Xu 和 ArakiL76] 用 SVM 建立 一 个 电视 节目 推荐 系统 。 他 们 用 电子 节目 向 导 (Elec- 
tronic Program Guide，EPG) 的 信息 作为 特征 。 但 是 为 了 减少 特征 ， 他 们 移 除了 最 低频 次 
的 单词 。 此 外 ， 为 了 评价 不 同 的 方法 ， 他 们 用 布尔 值 和 词 频 率 - 逆 文 档 频率 (TFIDF) 来 衔 
量 特征 结构 的 权重 。 在 前 者 ，0 和 1 被 用 来 代表 在 内 容 中 物品 的 缺失 或 出 现 。 在 后 者 则 变 
成 词 频率 - 逆 文 档 频 率 数值 。 

Xia 等 [75] 提 出 用 不 同 的 方法 来 使 用 SVM 在 CF 环境 中 做 推荐 。 他 们 探索 平滑 SVM 
(SSVM) 的 使 用 。 他 们 也 介绍 了 一 个 基于 SSVM WA RRA, ERA EAP y h E 
阵 中 的 缺失 元 素 。 他 们 通过 为 每 一 个 用 户 创建 一 个 分 类 器 来 计算 预测 值 。 实 验 结果 显示 ， 
与 SSVM 以 及 传统 的 基于 用 户 和 基于 物品 的 CF 相 比 ，SSVMBH 实验 结果 最 好 。 最 后 ， 
Oku 等 [27] 为 情景 感知 推荐 系统 提出 情景 感知 SVM(C-SVM) 的 使 用 方法 。 他 们 比较 了 标 
准 SVM、C-SVM 和 一 种 既 使 用 CF 又 使 用 C-SVM 的 扩展 算法 。 结 果 显 示 在 餐厅 推荐 中 
情景 感知 方法 最 有 效 。 


2.3.7 分 类 器 的 集成 


使 用 分 类 器 集成 背后 的 最 基本 的 思想 是 ， 从 训练 数据 构造 一 系列 的 分 类 器 ， 并 通过 聚 
集 预 测 值 来 预测 类 标签 。 只 要 我 们 能 假设 这 些 分 类 器 都 是 独立 的 ， 分 类 器 集成 就 有 效 。 在 
这 种 情况 下 ， 我 们 可 以 确定 分 类 器 产生 的 最 粳 糕 的 结果 与 在 集成 中 的 最 坏 分 类 是 一 样 的 。 
因此 ， 结 合 具有 相似 的 分 类 错误 的 独立 分 类 器 将 只 会 提升 结果 。 

为 了 产生 集成 ， 有 几 种 可 能 的 方法 。 最 常用 的 两 个 技术 是 Bagging 和 Boosting。 在 
Bagging 方法 中 ， 我 们 采用 带 替换 的 抽样 ， 在 每 一 个 自 举 样本 (bootstrap sample) 上 建立 分 


类 。 每 一 个 样本 被 选择 的 概率 是 1 一 坟 ) ， 如 果 N 足够 大 ， 那 和 其 值 会 趋 近 于 1l 
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0. 623。 在 Boosting 方法 中 ， 我 们 通过 更 加 关注 之 前 错误 分 类 的 记录 ， 使 用 迭代 过 程 自 适 
应 地 改变 训练 数据 的 分 布 。 一 开始 ， 所 有 的 记录 都 被 分 配 相 同 的 权 值 。 但 是 ， 不 像 Bag- 
ging 方法， 在 每 一 轮 的 提升 中 权 值 是 可 以 变化 的 : 被 错误 分 类 的 记录 权 值 将 会 增加 ， 同 时 
正确 分 配 的 记录 的 权 值 将 会 降低 。Boosting 方法 的 例子 是 AdaBoost 算法 。 

分 类 器 集成 使 用 的 例子 在 推荐 领域 里 面 非常 实用 。 事 实 上 ， 任何 一 个 混合 技术 [16] 都 
可 以 理解 成 以 一 种 方式 集成 或 另外 几 个 分 类 器 的 集成 。Tiemann 和 Pauws 的 音乐 推荐 系 
统 就 是 一 个 明显 的 实例 ， 他 们 用 集成 学 习 方 法 来 结合 基于 社交 的 和 基于 内 容 的 推荐 
系统 [70]。 

实验 结果 显示 ， 集 成 器 能 产生 比 其 他 任何 孤立 的 分 类 器 更 好 的 结果 。 例 如 ，Bell 等 
[11j 在 解决 Netflix 挑战 、 赢 得 大 奖 的 方案 中 使 用 结合 了 107 种 不 同 的 方法 。 他 们 的 发 现 
显示 ， 本 质 上 不 同 的 方法 比 提 升 一 种 单一 特殊 技术 的 回报 要 好 。 为 了 从 集合 器 中 混合 结 
果 ， 他 们 采用 线性 回归 方法 。 为 了 给 每 一 个 分 类 器 生成 权 值 ， 他 们 把 测试 数据 集 分 成 15 
个 不 同 的 部 分 ， 并 且 为 每 一 个 备份 生成 唯一 的 系数 。 在 Netflix 环境 中 的 不 同 的 集成 方法 
可 以 追溯 到 其 他 的 方法 ， 如 Schclar 等 的 [67] 或 Toescher 等 的 [71] 。 

自 举 方法 也 已 经 在 推荐 系统 使 用 ， 例 如 ，Freund 等 提出 一 个 被 称 为 RankBoost 的 算 
法 来 结合 用 户 的 偏好 [32]。 他 们 应 用 这 个 算法 在 CF 环境 中 来 产生 电影 推荐 。 


2.3.8 评估 分 类 器 


推荐 系统 中 被 接受 最 常用 的 指标 是 预测 兴趣 (评分 ) 和 测量 值 的 均 方 差 (MAE) 或 均 方 
根 误差 (RMSE)。 这 些 指标 在 计算 精度 时 对 推荐 系统 的 目标 没有 任何 假设 。 (A, EM 
McNee 等 [51] 指 出 的 那样 ， 除 了 精确 度 ， 还 有 许多 指标 来 决定 物品 是 否 要 被 推荐 。Her- 
locker 等 [42] 发 表 了 推荐 系统 算法 指标 方法 的 综述 。 他 们 建议 某 些 指标 对 于 某 些 推荐 任务 
可 能 更 加 合适 。 但 是 ， 如 果 在 一 类 推荐 算法 和 单个 数据 集 上 要 根据 经 验 来 评估 不 同方 法 ， 
他 们 不 能 验证 这 些 指标 。 

下 一 步 要 考虑 的 是 ,“ 现 实 ” 中 推荐 系统 的 目的 是 产生 一 个 top-N 推荐 列表 ， 以 及 依赖 
于 能 多 好 地 分 辨 出 值得 推荐 的 物品 来 评估 这 个 推荐 系统 。 如 果 把 推荐 看 作 分 类 问题 ， 就 可 
以 使 用 评估 分 类 器 的 著名 指标 ， 如 准确 度 和 召回 率 。 在 如 下 的 段落 中 ， 我 们 将 概述 一 部 分 
这 些 指标 及 其 在 推荐 评价 中 的 应 用 。 但 是 值得 注意 的 是 ， 学 习 算 法 和 分 类 能 够 被 多 个 准 测 
来 评估 。 这 包含 执行 分 类 的 准确 率 、 训 练 数 据 的 计算 复杂 度 、 分 类 的 复杂 度 、 噪 声 数 据 的 
敏感 度 、 可 扩展 性 等 。 但 是 在 本 章 中 我 们 将 只 关注 分 类 性 能 。 

为 了 评估 一 个 模型 ， 我 们 一 般 考 虑 以 下 的 指标 : RECP): 分 到 类 A 且 真 的 属于 类 
A 的 实例 数量 ; 真 负 (TN): 没有 分 到 类 A 且 真 的 不 属于 类 A 的 实例 数量 ; 假 正 (FP): 
分 到 类 A 但 不 属于 类 A 的 实例 数量 ; 假 负 (FN): 没有 分 到 类 A 但 属于 类 A 的 实例 数量 。 

最 常用 来 衡量 模型 性 能 是 定义 正确 分 类 的 (属于 或 不 属于 给 定 的 类 ) 实 例 和 总 的 实例 
数量 之 间 的 比率 : 精确 度 ==(TP 十 TN)/(TP 十 TN 十 FP 十 FN)。 但 是 ， 精 确 度 在 许多 
的 例子 中 有 误导 。 想 象 一 个 带 有 99900 个 类 A 的 样本 和 100 个 类 B 的 样本 的 两 类 分 类 
问题 。 如 果 分 类 器 简单 地 预测 一 切 属于 类 A, 计算 精 度 可 能 是 99.926, 但 是 模型 性 能 
值得 怀疑 ， 因 为 它 从 没有 发 现 类 B 中 的 样本 。 改 进 这 种 估 值 的 一 种 方法 是 定义 代价 甜 
阵 ， 定 义 将 类 B 的 样本 分 给 类 A 的 代价 。 在 真实 的 应 用 环境 中 ， 不 同类 型 的 错误 可 能 
的 确 有 不 同 的 代价 。 例 如 ， 如 果 100 个 样本 对 应 一 个 组 装 线 上 有 缺陷 的 飞机 部 分 ， 不 正 
确 地 拒绝 一 个 没有 缺陷 的 部 分 (1/99 900 的 样本 ) 相 比 于 错误 地 把 缺陷 的 部 分 当 作 好 的 ， 
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这 个 代价 是 微不足道 的 。 

模型 性 能 的 其 他 常用 指标 ， 特 别 是 在 信息 检索 中 ， 是 准确 率 和 召回 率 。 准 确 率 ， 定 义 
为 P=TP/(TP 十 FP)， 是 一 种 在 分 样本 到 类 A 中 犯错 误 的 指标 。 男 一 方面 ， 召 回 率 ， 
R= 二 TP/(TP 十 FN)， 衡 量 没 有 留 下 本 应 该 划分 到 类 中 的 样本 的 程度 。 注 意 在 大 部 分 的 例 
子 中 ， 当 我 们 单独 使 用 这 两 种 指标 时 是 有 误导 的 。 通 过 不 分 给 任何 的 样本 到 类 A 可 以 建立 
有 完美 预测 准确 性 的 分 类 器 (因此 TP 为 零 但 FF 也 为 零 )。 相 反 ， 通 过 分 配 所 有 的 样本 到 
类 A 中 可 以 建立 完美 召回 率 的 分 类 器 。 事 实 上 ， 有 一 种 结合 了 预测 和 召回 率 到 一 个 单一 指 


7 2RP 2TP 
标 中 的 指标 : Fi p= TPLFNTFP' 


有 时 我 们 会 比较 几 个 相互 竞争 的 模 
型 ， 而 不 是 单独 评估 它们 的 性 能 。 为 此 ， 
我 们 使 用 在 20 世纪 50 年 代 开 发 的 用 来 分 
析 品 声 信号 的 技术 : 接受 者 操作 特征 曲线 
(ROO), ROC 曲线 描述 了 正确 击 中 和 假 
警告 之 间 的 特征 。 每 一 个 分 类 的 性 能 用 曲 
线 上 的 点 表示 ( 见 图 2.7). . 

Ziegler 等 [80] 表 示 通 过 top-N 列表 指标 
评估 推荐 算法 不 能 直接 映射 出 用 户 的 效率 函 
数 。 但 是 ， 它 的 确 解决 了 一 些 普 遍 接 受 的 精 
确 指标 的 限制 ， 如 MAE。 例 如 ，Basu 等 F 
[10]， 通 过 分 析 在 评价 规模 中 前 四 分 之 一 被 0 0.2 0.4 0.6 0.8 1 





真正 比率 





预测 的 物品 哪些 确实 被 用 户 评价 为 前 四 分 之 IER 
—, McLaughlin 和 Herlocker[50] 提 出 一 种 2.7 ROC 曲线 的 例子 。 模式 1 表现 好 于 低 假 
修改 后 的 精确 指标 ， 认 为 没有 评价 的 物品 计 et e ire 


并 且 模 式 的 假 正 比率 优 于 模式 2 的 2. 
为 不 推荐 。 这 个 预测 指标 事实 上 代表 了 真实 ARE LMR TAR 2 69 2.5 


精确 性 的 下 限 。 尽 管 能 够 从 准确 率 和 召回 率 上 直接 得 出 F- 测 量 法 ， 但 是 在 推荐 系统 评估 中 很 
少 有 人 用 到 。Huang 等 [43] 和 Bozzonet 等 [13]， 以 及 Miyahara 和 PazzaniL 52. 是 使 用 这 些 指标 
的 少数 几 个 例子 。 

ROC 曲线 也 已 经 在 评估 推荐 系统 时 使 用 。 当 在 受到 攻击 下 比较 不 同 算法 的 性 能 时 ， 
Zhang 等 [64] 使 用 ROC 曲线 下 的 面积 作为 评估 的 指标 。 Banerjee 和 Ramanathan[ 8 ] th {# 
用 ROC 曲线 来 比较 不 同 模型 的 性 能 。 

必须 指出 的 是 ， 好 的 评估 指标 的 选择 ， 即 使 在 top-N 推荐 系统 中 ， 仍 是 一 个 研究 点 。 
许多 作者 提出 了 只 用 间接 相关 到 这 些 传统 的 评估 模式 的 指标 。 例 如 ，Deshpande 和 Kary- 
pisL25] 提 出 了 命中 率 和 平均 逆 命中 率 的 使 用 。 另 一 方面 ，Breese 等 [15] 将 排序 列表 中 推 
荐 结果 的 效用 指标 定义 成 中 立 投票 的 函数 。 

注意 ， 第 8 章 会 详细 描述 在 推荐 系统 内 容 中 这 些 评 估 指 标的 使 用 ， 因 此 如 果 你 对 这 个 
问题 感 兴趣 ， 你 可 以 从 那 一 章 继续 学 习 。 


2.4 BADR 


扩展 CF 分 类 器 的 最 大 问题 是 计算 距离 时 的 操作 量 ， 如 发 现 最 好 的 K 近邻 。 如 我 们 在 
2.2.3 节 中 所 看 到 那样 ， 一 种 可 能 的 解决 方法 是 降 维 。 但是， 即使 降低 了 特征 维度 ， 仍 有 
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许多 对 象 要 计算 距离 ， 这 就 是 聚 类 算法 的 用 武之 地 。 基 于 内 容 的 推荐 系统 也 是 这 样 BE 
相似 对 象 也 需要 计算 距离 。 由 于 操作 量 的 减少 ， 聚 类 可 以 提高 效率 。 但 是 ， 不 像 降 维 方 
法 ， 它 不 太 可 能 提高 精确 度 。 因 此 ， 在 设计 推荐 系统 时 必须 谨慎 使 用 聚 类 ， 必 须 小 心地 衡 
量 提高 效率 和 降低 精度 之 间 的 平衡 。 

聚 类 L41]， 也 称 为 无 监督 的 学 习 ， 分 配 物 品 到 一 个 组 中 使 得 在 同一 组 中 的 物品 比 不 同 
组 中 的 物品 更 加 类 似 : 目的 是 发 现存 在 数据 中 的 自然 (或 者 说 是 有 意义 ) 的 组 。 相 似 度 是 由 
距离 衡量 决定 的 ， 如 在 2. 2. 1 节 中 叙述 的 。 聚 类 算法 的 目标 是 在 最 小 化 群 内 距离 的 同时 最 
大 化 群 间距 离 。 

聚 类 算法 有 两 个 主要 的 类 别 : 分 层 和 划分 。 划 分 聚 类 算法 把 数据 划分 成 非 重 合 的 聚 
类 ， 使 得 每 一 个 数据 项 确切 在 一 个 聚 类 中 。 分 层 聚 类 算法 在 已 知 聚 类 上 继续 聚合 物品 ， 生 
成 聚 类 的 艇 套 集合 ， 组 成 一 个 层级 树 。 

许多 聚 类 算法 试图 最 小 化 一 个 函数 来 衡量 聚 类 的 质量 。 这 样 的 质量 函数 一 般 被 称 为 目 
标 函 数 ， 因 此 聚 类 可 以 看 作 最 优化 的 问题 : 理想 聚 类 算法 考虑 所 有 可 能 数据 划分 ， 并 且 输 
出 最 小 化 质量 函数 的 划分 。 但 相应 的 最 优化 问题 是 NP 难 问 题 ， 因 此 许多 算法 采用 启发 式 
方法 (例如 ，k-means 算法 中 局 部 最 优化 过 程 最 可 能 结束 于 局 部 最 小 ) 。 主 要 问题 还 是 聚 类 
问题 太 难 了 ， 很 多 情况 下 要 想 找到 最 优 解 就 是 不 可 能 的 。 同 样 的 原因 ， 特 殊 聚 类 算法 的 选 
择 和 它 的 参数 (如 相似 度 测 量 ) 取 决 于 许多 的 因素 ， 包 括 数据 的 特征 。 在 下 面 的 章节 将 描述 
k-means 聚 类 算法 和 其 他 的 候选 算法 。 


2.4.1 k-means 


k-means 聚 类 是 一 种 分 块 方法 。 函 数 划分 六 个 物品 的 数据 集 到 A SAN AR T fe S, 
其 中 包含 N; 物品 ， 以 便于 它们 按照 给 定 的 距离 指标 尽 可 能 地 靠近 。 在 分 块 中 每 一 个 聚 类 
通过 它 的 N 个 成 员 和 它 的 中 心 点 4; 来 定义 。 每 一 个 聚 类 的 中 心 点 是 聚 类 中 所 有 其 他 物品 


到 它 的 距离 之 和 最 小 的 那个 点 。 因 此 ， 我 们 定义 k-means 算法 作为 迭代 来 最 小 化 1 一 二 ~ 


0. 623， 其 中 x, 是 向 量 ， 代 表 第 n Wh. A; 是 在 S; 中 物品 的 中 心 点 ， 并 且 d 是 距离 尺 
度 。k-means 算法 移动 聚 类 间 的 物品 直到 下 不 再 进一步 降低 。 

算法 一 开始 会 随机 选择 个 中 心 点 。 所 有 物品 都 会 被 分 配 到 它们 最 靠近 的 中 心 节 点 的 
类 中 。 由 于 聚 类 新 添加 或 是 移出 物品 ， 新 聚 类 的 中 心 节点 需要 更 新 ， 聚 类 的 成 员 关 系 也 需 
要 更 新 。 这 个 操作 会 持续 下 去 ， 直 到 再 没有 物品 改变 它们 的 聚 类 成 员 关 系 。 算 法 第 一 次 和 迭 
代 时 ， 大 部 分 的 聚 类 的 最 终 位 置 就 会 发 生 ， 因 此 ， 跳 出 迭代 的 条 件 一 般 改 变 成 * 直 到 相对 
少 的 点 改变 聚 类 ”来 提高 效率 。 

基础 的 k-means 是 极其 简单 和 有 效 的 算法 。 但 是 ， 它 有 几 个 缺陷 : 1) 为 了 选择 合适 的 
k 值 ， 假 定 有 先 验 的 数据 知识 ; 2) 最 终 的 聚 类 对 于 初始 的 中 心 点 非常 敏感 ，3) 它 会 产生 空 
RA. k-means 也 有 几 个 关于 数据 的 缺陷 : 当 聚 类 是 不 同 的 大 小 、 密 度 、 非 球状 形状 时 ， 
就 会 有 问题 ， 并 且 当 数据 包含 异常 值 时 它 也 会 有 问题 。 

Xue 等 [77] 提 出 一 种 在 推荐 环境 中 典型 的 聚 类 用 法 ， 通 过 使 用 k-means 算法 作为 预 
处 理 步 又 来 帮助 构造 邻居 。 他 们 没有 将 邻居 限制 在 用 户 所 属 的 聚 类 内 ， 相 反 是 使 用 从 用 
户 到 不 同 聚 类 中 心 点 的 距离 作为 预选 阶段 发 现 邻居 。 他 们 实现 了 基于 聚 类 平滑 技术 ， 其 
技术 是 对 于 用 户 在 聚 类 中 的 缺失 值 被 典型 聚 类 取代 。 他 们 的 方法 据 称 比 标准 的 基于 
kNN 的 CF 效果 要 好 。 相 类 似 ，Sarwar 等 [26] 描 述 了 一 个 方法 来 实现 可 扩展 的 kNN 分 
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类 器 。 他 们 通过 平分 k-means 算法 来 划分 用 户 空间 ， 然 后 用 这 些 聚 类 作为 邻居 的 形成 的 
基础 。 据 称 与 标准 的 KNN 的 CF 相 比 准确 率 降低 了 大 约 5%。 但 是 ， 他 们 的 方法 显著 地 
提高 了 效率 。 

Connor 和 Herlocker[21] 提 出 不 同 的 方法 ， 他 们 聚 类 物品 而 不 是 用 户 。 使 用 Pearson 
相关 相似 度 指标 ， 他 们 尝试 四 种 不 同 算法 : 平均 链接 分 层 聚 集 [39]， 对 于 分 类 属性 的 健壮 
聚 类 算法 (ROCK)[40]: kMetis 和 hMetis? 。 尽 管 聚 类 的 确 提 高 了 效率 ， 但 是 所 有 的 聚 类 
技术 的 确 比 非 分 类 基线 精确 度 和 覆盖 度 要 差 。 最 后 ，Li 等 [60] 以 及 Ungar 和 Foster[72] 
提出 一 种 非常 类 似 的 方法 ， 使 用 k-means 聚 类 来 解决 推荐 问题 的 概率 模型 解释 。 


2.4.2 改进 的 k-means 


基于 密度 的 聚 类 算法 ， 诸 如 ，DBSCAN 通过 建立 密度 定义 作为 在 一 定 范围 内 的 点 的 
数量 。 例 如 ，DBSCAN 定义 了 三 种 点 : 核心 点 是 在 给 定 距 离 内 拥有 超过 一 定数 量 邻 居 的 
点 ; 边界 点 没有 超过 指定 数量 的 邻居 但 属于 核心 点 邻居 ; 噪声 点 既 不 是 核心 点 也 不 是 边界 
点 。 算 法 迭代 移 除 掉 噪声 数据 并 且 在 剩 下 的 点 上 进行 聚 类 。 

消息 传递 聚 类 算法 是 最 近 基 于 图 聚 类 方法 的 系列 之 一 。 消 息 传递 算法 没有 一 开始 就 将 
节点 的 初始 子 集 作 为 中 心 点 ， 然 后 逐渐 调适 ， 而 是 一 开始 就 将 所 有 节点 都 看 作 中 心 点 ， 一 
般 称 为 标本 。 在 算法 执行 时 ， 这 些 点 ， 现 在 已 经 是 网 络 中 的 节点 了 ， 会 交换 消息 直到 聚 类 
逐渐 出 现 。 相 似 传播 是 这 种 系列 算法 的 代表 ， 通 过 定义 节点 之 间 的 两 种 信息 来 起 作用 : 
“责任 ”， 反 映 了 在 考虑 其 他 潜在 标本 的 情况 下 ， 接 收 点 有 多 适合 作为 发 送 点 的 标本 ;“ 可 
用 性 ”， 从 候选 标本 发 送 到 节点 ， 它 反映 了 在 考虑 其 他 选择 相同 标本 的 节点 支持 的 情况 下 ， 
这 个 节点 选择 候选 标本 作为 其 标本 的 合适 程度 。 相 似 传 播 已 经 被 应 用 到 DNA 序列 聚 类 ， 
在 图 形 中 人 脸 聚 类 ， 或 者 是 文本 摘要 等 不 同 问 题 ， 并 且 效 果 很 好 。 

最 后 ， 分 层 聚 类 按照 层级 树 (树枝 形 结构 联系 图 ) 的 结构 产生 一 系列 峙 套 聚 类 。 分 层 聚 
类 不 会 预先 假设 聚 类 的 既定 数量 。 同 样 ， 任 何 数量 的 聚 类 都 能 够 通过 选择 合适 等 级 的 树 来 
获得 。 分 层 聚 类 有 时 也 与 有 意义 的 分 类 学 相关 。 传 统 的 分 层 算法 使 用 一 个 相似 度 或 者 距离 
和 矩阵 来 合并 或 分 裂 一 个 聚 类 。 有 两 种 主要 方法 来 分 层 聚 类 。 在 聚集 分 层 聚 类 中 ， 我 们 以 点 
作为 个 体 聚 类 ， 并 且 每 一 个 步 合 并 最 近 的 聚 类 对 ， 直 到 只 有 一 个 (或 是 &A 个 聚 类 ) 聚 类 剩 
下 。 分 裂 分 层 聚 类 从 一 个 包含 所 有 物品 的 聚 类 开始 ， 并 且 每 一 个 分 裂 每 一 聚 类 ， 直 到 每 一 
聚 类 包含 一 个 点 (或 是 有 个 聚 类 ) 。 

就 我 们 所 知 ， 诸 如 前 面 提 到 k-means 的 替代 方法 没有 应 用 在 推荐 系统 中 。k-means 算 
法 的 简单 和 效率 优 于 它 的 替代 算法 。 基 于 密度 或 者 是 分 层 聚 类 方法 在 推荐 系统 领域 能 起 的 
作用 还 不 是 很 清楚 。 另 一 方面 ， 消 息 传递 算法 已 经 显示 了 其 高 效 的 特点 ， 并 且 基 于 图 的 范 
… 例 很 容易 转换 成 推荐 问题 。 在 未 来 一 段 时 间 内 我 们 看 到 这 些 算 法 的 应 用 是 可 能 的 。 


2.5 关联 规则 挖掘 


关联 规则 挖掘 关注 于 规则 的 发 现 ， 其 他 能 够 根据 事务 中 出 现 其 他 物品 来 预测 出 现 某 个 
物品 。 两 个 物品 被 发 现 相关 只 意味 着 共同 出 现 ， 但 是 没有 因果 关系 。 注 意 不 要 将 这 种 技术 
与 在 2. 3. 3 节 中 提 到 的 基于 规则 的 分 类 混淆 。 
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我 们 定义 物品 集 为 一 个 或 多 个 物品 的 集合 (例如 ，( 牛 奶 ， 啤 酒 ， 尿 布 ))。k- 物 品 集 是 
包含 & 个 物品 的 集合 。 给 定 物品 的 频繁 度 称 为 支持 量 ( 比 如 ，( 和 牛奶， 啤酒， 尿布 ) 二 131)。 
并 且 物 品 集 的 支持 度 是 包含 它 的 事务 的 比例 (例如 ，( 牛 奶 ， 啤 酒 ， 尿 布 )=0. 12) 。 频 繁 物 
品 集 是 支持 度 大 于 或 等 于 最 小 支持 度 阔 值 的 物品 集 。 关 联 规则 是 公式 X>Y 的 表达 式 ， 其 
中 X 和 YY 是 物品 集 。( 例 如 ， 和 牛奶， 尿布 二 啤酒 )。 在 这 个 案例 中 ， 关 联 规则 的 支持 度 是 
同时 拥有 XA Y 的 事务 的 比例 。 另 一 方面 ， 规 则 的 置信 度 是 Y 中 的 物品 有 多 经 常 出 现在 
包含 X 的 事务 中 。 

给 定 一 组 事务 集合 T， 关 联 规则 挖掘 的 目标 是 发 现 具有 支持 度 大 于 等 于 最 小 支持 度 阅 
值 以 及 置信 和 度 大 于 等 于 最 小 置信 和 度 阐 值 的 所 有 规则 。 暴 力 法 将 会 列 出 所 有 可 能 的 关联 规 
则 ， 为 每 一 个 规则 计算 支持 度 和 置信 和 度 ， 然 后 删除 不 满足 两 个 条 件 的 规则 。 但 是 ， 这 样 的 
计算 开销 太 大 。 因 此 ， 我 们 采用 两 步 方法 : 1) 产 生 了 所 有 支持 度 大 于 等 于 最 小 支持 度 的 物 
品 集 (频繁 项 集 生成 ); 2) 从 每 一 频繁 物品 集中 产生 高 置信 规则 (规则 产生 )。 

有 几 个 技术 来 优化 频繁 物品 集 的 产生 。 在 一 个 广泛 的 意义 上 ， 它 们 可 以 分 成 : 尝试 最 
小 化 候选 集 数量 (M)， 降 低 事务 量 (N)， 降 低 比较 量 数量 (NM)。 但 是 最 常用 的 方法 是 使 
用 先 验 规则 来 降低 候选 数量 。 这 个 原则 表明 如 果 物 品 集 是 频繁 的 ， 那 么 所 有 的 子 集 也 是 频 
繁 的。 支持 度 的 衡量 标准 已 经 验证 了 这 一 点 ， 因 为 一 个 物品 集 的 支持 度 永远 不 会 超过 其 子 
集 的 支持 度 。Apriori 算法 是 这 个 规则 实际 的 实现 。 

给 定 一 个 频繁 集 工 ， 产 生 规 则 时 的 目的 是 发 现 所 有 满足 最 小 的 置信 度 需求 的 非 空子 
集 。 如 果 | 工 |=&， 那 么 有 2k2 条 候选 关联 规则 。 因 此 ， 在 生成 频繁 物品 集 时 ， 需 要 找到 
高 效 的 方法 来 生成 规则 。 对 于 Apriori 算法 ,我 们 能 通过 合并 规则 结果 中 共用 相同 前 缀 的 
两 个 规则 来 产生 候选 规则 。 

关联 规则 在 发 现 模式 和 推动 个 性 化 市 场 营销 方面 的 显著 效果 闻名 已 久 [2]。 但 是 ， 尽 
管 这 些 方法 和 推荐 系统 的 目标 之 间 有 明显 的 关联 ， 但 是 它们 还 是 没有 成 为 主流 。 主 要 原因 
是 这 种 方法 类 似 于 基于 物品 的 .CF 但 缺少 灵活 性 ， 因 为 它 需要 事务 这 个 明确 的 概念 一 一 事 
件 共 同 出 现在 某 个 给 定 的 会 话 中 。 在 第 3 章 中 我 们 将 举 一 一 些 有 意义 的 例子 ， 其 中 一 些 表明 
关联 规则 仍 有 潜力 。 

Mobasher 等 [53] 提 出 一 种 基于 关联 规则 的 个 性 化 网 页 系统 。 他 们 的 系统 基于 用 户 的 
导航 模式 ， 从 共同 出 现 的 浏览 页 面 来 识别 关联 规则 。 他 们 在 精确 度 和 覆盖 率 指标 方面 优 于 
基于 kNN 的 推荐 系统 。Smyth 等 [68] 提 出 给 推荐 系统 使 用 关联 规则 的 两 种 不 同 的 研究 案 
例 。 在 第 一 种 案例 中 ， 为 了 生成 较 好 的 物品 -物品 相似 度 指 标 ， 他 们 从 用 户 属性 中 使 用 先 
验算 法 来 抽 离 物品 关联 规则 。 在 第 二 种 案例 中 ， 他 们 应 用 关联 规则 到 会 话 推荐 中 。 这 里 的 
目标 是 发 现 共同 发 生 的 评论 ， 比 如 ， 用 户 通过 一 个 推荐 物品 的 特定 特征 表明 偏好 。Lin 等 
[49] 提 出 一 种 新 的 关联 规则 挖掘 算法 ， 为 了 获得 一 个 合适 的 有 意义 规则 数量 ， 在 挖掘 期 间 
调整 规则 的 最 小 支持 度 ， 因 此 解决 了 先前 像 Apriori 这 样 算法 的 某 些 缺陷 。 他 们 挖掘 在 用 
户 之 间 和 物品 之 间 的 关联 规则 。 测 量 出 的 精确 度 优 于 基于 相关 度 推荐 的 报告 值 ， 并 且 接 近 
于 更 精巧 的 方法 ， 如 SVD 和 ANN 的 结合 。 

最 后 ， 如 在 2. 3. 2 节 中 提 到 的 那样 ，Cho 等 [18] 在 一 个 网 页 商店 推荐 系统 中 结合 了 决 
策 树 和 关联 规则 挖掘 。 在 他 们 的 系统 ， 关 联 规则 的 导入 是 为 了 链接 相关 的 物品 集 。 然 后 通 
过 连接 用 户 偏好 和 关联 规则 来 计算 得 出 推荐 结果 。 他 们 在 不 同 的 事务 集中 寻找 关联 规则 ， 
如 商品 ， 购 物 车 ， 点 击 率 。 他 们 用 启发 式 学 习 给 每 一 个 事务 集中 规则 附加 权重 。 例 如 ， 商 
品 关 联 规则 权重 大 于 点 击 关 联 规则 。 
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2.6 总 结 


本 章 介绍 了 在 设计 推荐 系统 中 可 能 用 到 的 主要 的 数据 挖掘 方法 和 技术 。 我 们 也 总 结 了 
在 文献 中 提 到 的 用 法 ， 提 供 了 如 何以 及 在 哪 用 到 它们 一 些 粗 略 指导 。 

我 们 从 综述 在 预 处 理 步 又 可 能 用 到 的 技术 开始 。 首 先 ，2. 2. 1 节 回 顾 了 如 何 选择 合适 
的 距离 衡量 指标 。 在 后 面 的 步骤 中 大 部 分 的 方法 需要 它 。 余 弦 相 似 度 和 皮尔 逊 相关 度 是 一 
般 可 接受 最 好 的 选择 。 尽 管 付出 了 许多 的 努力 来 提高 这 些 距离 指标 ,但 是 最 近 的 工作 似乎 
表明 距离 函数 的 选择 不 是 这 么 重要 。 然 后 ， 在 2. 2. 2 节 回 顾 了 最 基础 的 抽样 ， 其 应 用 是 为 
了 选择 原始 大 数据 集 的 子 集 ， 或 者 是 划分 训练 和 测试 集 。 最 后 ， 我 们 讨论 降 维 技术 的 使 
Hi. 诸如， 在 2. 2. 3 节 中 主 成 分 分 析 (PCA) 和 奇异 值 分 解 (SVD) 作 为 一 种 方法 来 解决 维度 
灾难 问题 。 我 们 解释 了 一 些 使 用 降 维 技术 的 成 功 案 例 ， 特 别 是 在 Netflix 大 奖 的 环境 中 。 

在 2. 3 节 中 ， 我 们 回顾 了 主要 的 分 类 方法 : 即 近邻 ， 决 策 树 ， 基 于 规则 分 类 ， 贝 叶 斯 
网 络 ， 人 工 神经 网 络 ， 支 持 向 量 机 。 我 们 看 到 ， 尽 管 kKNN( 见 2.3.1 节 ) 的 CF 是 首选 的 方 
法 ， 但 是 所 有 这 些 方法 都 可 以 应 用 在 不 同 的 环境 中 。 决 策 树 ( 见 2. 3. 2 节 ) 可 以 被 用 来 导出 
基于 物品 内 容 的 模型 或 者 是 模拟 系统 的 特殊 部 分 。 决 策 规则 ( 见 2. 3. 3 节 ) 可 以 从 预先 存在 
的 决策 树 中 推导 出 ， 或 者 是 被 用 来 引入 商业 或 者 是 领域 知识 。 贝 叶 斯 网 络 ( 见 2. 3.4 节 ) 是 
基于 内 容 的 推荐 中 一 个 流行 的 方法 ， 但 它 也 可 以 用 来 生成 一 个 基于 模型 的 协同 过 滤 系 统 。 
类 似 的 方法 ， 人 工 神 经 网 络 能 够 被 用 来 导出 基于 模型 的 推荐 ， 也 可 以 用 来 结合 /混合 其 他 
几 种 算法 。 最 后 ， 支 持 向 量 机 ( 见 2. 3.6 节 ) 作 为 一 种 方法 来 推断 出 基于 内 容 的 分 类 或 者 是 
导出 CF 模型 而 流行 。 

对 于 推荐 系统 来 说 ， 选 择 合适 的 分 类 器 不 容易 ， 尤 其 是 一 些 感知 判断 任务 和 数据 依赖 
的 情况 下 。 在 CF 的 案例 中 ， 一 些 结果 似乎 表明 基于 模型 方法 ， 使 用 如 SVM 或 者 是 贝 叶 
斯 网 络 ， 能 够 稍微 提高 标准 kNN 分 类 的 性 能 。 但 是 ， 这 些 结果 不 显著 并 且 很 难 推广 。 在 
基于 内 容 的 推荐 系统 的 例子 中 有 些 证 据 表 明 ， 在 一 些 例子 中 贝 叶 斯 网 络 执行 效果 比 简单 方 
法 要 好 ， 如 决策 树 。 但 是 ， 更 加 复杂 的 非 线性 分 类 ， 如 ANN 或 SVM， 执行 效果 是 否 更 好 
还 不 是 很 清楚 。 

因此 ， 给 特定 的 推荐 任务 选择 合适 分 类 器 在 今天 仍 有 许多 探索 的 地 方 。 实 际 的 经 验 规 
则 是 从 最 简单 的 方法 做 起 ， 并 且 只 有 在 性 能 的 提升 值得 时 才 采 用 复杂 方法 。 性 能 增益 应 该 
平衡 不 同 的 维度 ， 如 预测 精确 度 或 计算 效率 。 

我 们 在 2. 4 节 中 回顾 了 聚 类 算法 。 聚 类 在 推荐 系统 中 一 般 被 用 来 提高 性 能 。 不 管 是 在 
用 户 空间 还 是 物品 空间 ， 较 早 进行 聚 类 步 又 都 能 减少 随后 要 做 的 计算 距离 的 操作 数量 。 但 
是 ， 这 一 般 以 较 低 的 精确 度 为 代价 ， 所 以 处 理 时 要 慎重 。 事 实 上 ， 通 过 使 用 降 维 技术 (如 
SVD) 提 高 效率 在 一 般 的 例子 中 是 好 的 选择 。 与 分 类 相反 ， 没 有 那么 多 的 聚 类 算法 在 推荐 
系统 的 环境 中 使 用 。k-means( 见 2. 4. 1 节 ) 算 法 由 于 简单 和 相对 有 效 ， 很 难 找到 实用 的 夫 
代 者 。 我 们 在 2. 4. 2 节 中 综述 了 它们 中 一 些 算法 ， 如 分 层 聚 类 或 消息 传递 算法 。 尽 管 这 些 
技术 还 没有 应 用 在 推荐 系统 中 ， 但 为 将 来 的 研究 提供 了 有 希望 的 出 路 。 

最 后 ， 在 2.5 节 中 ， 我 们 描述 了 关联 规则 并 总 结 了 它们 在 推荐 系统 的 使 用 。 关 联 规则 为 
推荐 物品 提供 了 直观 的 框架 ， 只 要 有 一 个 显 式 或 隐 式 的 事务 。 尽 管 存在 有 效 的 算法 来 计算 关 
联 规则 ， 而 且 已 经 被 证 明 比 标准 KNN 的 CF 准确 率 好 ， 但 是 他 们 仍 不 是 受 青睐 的 方法 。 

在 设计 推荐 系统 中 选择 正确 的 数据 挖 抉 技术 是 一 个 复杂 的 任务 ， 其 一 定 受 许多 特殊 问 
题 约束 。 但是， 我 们 希望 本 章 中 技术 和 经 验 的 简短 综述 能 够 帮助 读者 做 出 更 加 合理 的 决 
定 。 除 此 之 外 ， 我 们 也 发 现 了 有 待 进一步 提高 的 领域 和 令 人 兴奋 的 研究 点 ， 以 及 接 下 来 有 
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待 研 究 的 相关 研究 点 。 
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Pasquale Lops、Marco de Gemmis 和 Giovanni Semeraro 


摘要 ”推荐 系统 以 个 性 化 的 方式 指引 用 户 在 众多 选择 中 找到 感 兴趣 的 东西 。 基 于 内 容 
的 推荐 系统 会 发 掘 用 户 曾经 喜欢 的 产品 ， 从 而 尝试 去 推荐 类 似 的 产品 使 其 满意 。 事 实 上 ， 
基于 内 容 的 推荐 系统 主要 的 处 理 方式 在 于 利用 用 户 已 知 的 偏好 、 兴 趣 等 属性 和 物品 内 容 的 
属性 相 匹 配 ， 以 此 为 用 户 推 荐 新 的 感 兴趣 的 物品 。 本 章 概述 了 各 种 基于 内 容 的 推荐 系统 ， 
目的 是 在 其 各 种 设计 原理 和 实现 方法 中 理 出 头绪 。 本 章 第 一 部 分 介绍 了 基于 内 容 推 荐 的 基 
本 概念 、 专 业 术 语 、 高 层次 的 体系 结构 和 主要 的 优 缺 点 。 第 二 部 分 通过 详尽 描述 能 够 表示 
物品 和 用 户 信 息 的 经 典 先进 技术 ， 给 出 了 几 个 应 用 领域 内 使 用 的 最 先进 技术 的 概述 。 同 
时 ， 也 阐述 了 一 些 被 广泛 使 用 的 学 习 用 户 兴 趣 的 技术 。 最 后 一 部 分 讨论 了 推荐 系统 的 趋势 
和 下 一 代 推 荐 系统 的 研究 方向 ， 其 中 描述 了 考虑 到 在 词汇 表 不 断 演 变 情况 下 用 户 产 生 内 容 
(UGC) 的 作用 ， 以 及 为 用 户 提供 一 些 偶然 性 的 推荐 的 挑战 ， 即 推荐 出 乎 意料 地 能 够 让 用 户 
感 兴趣 ， 而 又 无 法 通过 其 他 方法 发 现 的 物品 。 


3.1 简介 


网 络 上 和 数字 图 书馆 中 ， 存 在 着 大 量 而 丰富 的 信息 ， 由 于 它们 的 动态 性 和 多 样 性 ， 很 
难 快速 找 出 我 们 想 要 的 或 最 能 满足 我 们 需求 的 东西 。 l 

因此 ， 用 户 建 模 和 个 人 资料 访问 的 作用 变 得 越 来 越 重要 : 根据 喜好 和 品位 ， 用 户 需 要 
个 性 化 的 支持 来 从 大 量 信息 中 筛选 出 可 用 信息 。 

大 量 的 信息 来 源 显 示 ， 推 荐 系统 是 能 够 满足 用 户 个 性 化 需求 的 一 种 方式 [73]。 推 荐 系统 
在 巨大 的 可 能 选择 范围 内 引导 用 户 发 现 感 兴趣 的 或 有 用 的 个 性 化 推荐 结果 [17]。 推 荐 算法 把 
用 户 的 兴趣 作为 输入 来 产生 一 个 推荐 列表 。 亚 马 逊 的 推荐 算法 用 于 为 每 个 用 户 定制 一 个 网 上 
商店 。 例 如 ， 为 软件 工程 师 显示 有 关 编 程 的 主题 ， 为 新 妈妈 显示 的 是 婴儿 玩具 [50]。 

物品 推荐 的 问题 已 经 有 广泛 的 研究 ， 现 有 两 类 主要 方式 。 基 于 内 容 的 推荐 系统 试图 推 
荐 给 定 用 户 过 去 喜欢 的 相似 物品 ， 而 协同 过 滤 推 荐 方式 的 系统 识别 出 拥有 相同 喜好 的 用 
户 ， 并 推荐 他 们 喜欢 过 的 物品 [7]。 

本 章 中 ， 我 们 对 基于 内 容 的 推荐 系统 进行 了 全 面 而 系统 的 研究 ， 其 目的 有 两 方面 : 

。 提供 研究 现状 的 概览 ， 着 重 讨论 最 有 效 的 技术 和 它们 被 采纳 的 应 用 领域 。 

。 指明 能 够 引领 下 一 代 基 于 内 容 的 推荐 系统 的 未 来 研究 趋势 和 方向 。 
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本 章 结构 如 下 : 3.2 节 介 绍 基于 内 容 的 推荐 系统 的 基本 概念 和 术语 。 通 过 讲解 经 典 的 
基于 内 容 的 推荐 系统 架构 来 理解 架构 中 的 主要 部 件 ， 以 及 在 产生 推荐 结果 的 过 程 中 ， 这 种 
类 型 的 推荐 技术 的 优 缺 点 。3. 3 节 全 面 介绍 最 前 沿 的 基于 内 容 的 推荐 系统 ， 还 全 面 描 述 了 
如 何 表示 物品 和 用 户 信息 的 经 典 方法 和 最 新 技术 ， 以 及 用 户 信息 的 学 习 方法 。3.4 E BAL 
了 基于 内 容 的 推荐 系统 技术 的 趋势 和 未 来 研究 方向 。3. 5 节 进 行 了 总 结 。 


3.2 基于 内 容 的 推荐 系统 的 基础 


基于 内 容 的 推荐 系统 通过 分 析 一 系列 用 户 之 前 已 评分 物品 的 文档 和 (或 ) 描 述 ， 从 而 基 
于 用 户 已 评分 对 象 的 特征 建立 模型 或 个 人 信息 [63]。 个 人 信息 是 用 户 兴趣 的 结构 化 描述 ， 
并 且 被 应 用 在 推荐 新 的 感 兴趣 的 物品 中 。 推 荐 的 主要 处 理 过 程 是 将 用 户 个 人 信息 的 特征 和 
内 容 对 象 的 特征 相 匹 配 ， 结 果 就 是 用 户 对 某 个 对 象 感 兴趣 程度 的 评价 。 如 果 这 份 个 人 信息 
准确 地 反映 了 用 户 的 偏好 ， 信 息 访 问 处 理 过 程 则 能 带 来 巨大 的 优势 。 例 如 ， 通 过 判断 这 个 
用 户 是 否 对 指定 网 页 感 兴趣 ， 以 及 在 不 感 兴趣 的 情况 下 阻止 显示 ， 从 而 达到 有 效 过 滤 搜 索 
结果 的 效果 。 


3.2.1 基于 内 容 的 推荐 系统 的 高 层次 结构 


基于 内 容 的 信息 过 滤 系 统 需要 描述 物品 和 生成 用 户 个 人 信息 的 恰当 技术 ， 以 及 一 些 能 
够 比较 用 户 个 人 信息 和 物品 描述 的 策略 。 一 个 基于 内 容 的 推荐 系统 的 高 层次 结构 如 图 3. 1 
所 示 。 推 荐 的 过 程 有 三 个 阶段 ， 每 一 阶段 都 由 独立 的 部 件 控制 。 


用 户 以 | 用 户 U。 | C 
训练 样本 相关 反馈 
反馈 


图 3.1 基于 内 容 的 推荐 系统 的 高 层次 结构 
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。 内 容 分 析 器 : 当 信息 没有 结构 化 时 (如 文本 )， 某 些 预 处 理 阶段 需要 抽取 相关 的 结 
构 化 信息 。 这 个 部 件 的 主要 功能 就 是 将 来 自信 息 源 的 对 象 ( 如 文档 、 网 页 、 新 闻 、 
产品 描述 等 ) 的 内 容 表 示 成 恰当 的 格式 ， 以 便于 下 一 阶段 的 处 理 。 数 据 对 象 经 过 特 
征 抽取 技术 的 分 析 ， 目 的 是 将 原始 信息 空间 转换 到 想 要 的 物品 描述 格式 (如 将 网 页 
表示 成 关键 词 向 量 ) 。 这 样 的 描述 格式 作为 信息 学 习 器 和 过 滤 组 件 的 输入 。 

。 信息 学 习 器 : 这 个 模块 收集 了 有 关 用 户 偏好 的 数据 特征 ， 并 试图 去 泛 化 这 些 数据 ， 

从 而 构建 用 户 特 征 信息 。 泛 化 策略 通常 是 通过 机 器 学 习 技 术 实现 的 [61]， 它 可 以 
从 用 户 过 去 喜欢 的 或 不 喜欢 的 物品 中 推断 出 一 个 用 户 的 兴趣 模型 。 例 如 ， 网 页 推 
荐 的 信息 学 习 器 可 以 实现 相关 的 反馈 方法 L75]， 通 过 学 习 技术 将 正 负 样 例 向 量 组 
合 到 一 个 表示 用 户 特征 的 模型 向 量 中 。 训 练 样本 是 由 用 户 提 供 的 具有 正 负 反馈 的 
网 页 。 

。 过 滤 组 件 : 这 个 模块 将 用 户 个 人 信息 和 物品 在 表示 空间 进行 匹配 ， 利 用 用 户 个 人 
言 息 来 推荐 相关 物品 。 这 个 组 件 的 结果 是 一 个 二 元 的 或 者 连续 型 的 相关 性 判断 (使 
用 某 种 相似 度 来 计算 [42])， 后 者 能 生成 一 个 潜在 感 兴趣 物品 的 排名 清单 。 在 上 面 
提 过 的 例子 中 ， 这 种 匹配 是 通过 计算 原型 向 量 和 物品 向 量 的 余弦 相似 度 得 到 的 。 

推荐 步骤 的 第 一 个 阶段 是 由 内 容 分 析 器 完成 的 ， 它 通常 是 借鉴 了 信息 检索 系统 的 技术 
[80，6]。 来 自信 息 源 的 物品 描述 经 过 内 容 分 析 器 ， 从 非 结构 化 的 文本 中 抽取 特征 (如 关键 
词 、n-grams、 概 念 等 )， 从 而 得 到 结构 化 的 物品 描述 ， 并 储存 在 被 表示 物品 库 中 。 

为 了 结构 化 和 更 新 活跃 用 户 u (必须 为 其 提供 推荐 的 用 户 ) 的 个 人 信息 ， 该 用 户 对 物品 
的 偏好 反应 是 通过 某 些 渠道 收集 并 记录 在 反馈 库 中 的 。 这 些 被 称 作 注 释 L39j] 或 反馈 的 相互 
作用 和 物品 的 相关 描述 一 起 被 用 在 模型 学 习 的 过 程 中 ， 这 些 信息 对 实际 中 预测 新 的 相关 物 
品 的 表示 非 党 有用。 因此， 即使 没有 提供 任何 反馈 ， 用户 也 可 以 清晰 地 定义 他 们 自己 感 兴 
趣 的 领域 作为 初始 的 个 人 信息 。 

通常 情况 下 ， 我 们 能 够 区 分 这 两 种 类 型 的 相关 性 反馈 : 正面 的 信息 (用 户 喜 欢 的 特征 ) 
和 负面 的 信息 (用 户 不 感 兴趣 的 特征 L43]) 。 

两 种 不 同 的 技术 都 能 用 来 记录 用 户 的 反馈 。 当 系统 要 求 用 户 明确 评价 物品 时 ，j 这 项 技 
术 通 常 称 作 “ 显 式 反馈 ”; 反之 ， 则 称 作 “ wast ， 由 于 反馈 来 自 监控 和 分 析 用 户 的 行 
为 ， 所 以 它 不 需要 任何 活跃 用 户 的 参与 。 

确切 的 评价 能 够 表明 用 户 对 一 个 物品 相关 或 感 兴趣 的 程度 [74]。 主 要 有 三 种 方式 来 得 
i 

喜欢 /不 喜欢 : 利用 一 个 简单 的 二 元 化 评分 刻度 ， 将 物品 分 成 “相关 的 ”或 “不 相关 
如 [12]。 

。 评分 : 经 常用 来 评价 物品 的 一 个 离散 的 数值 刻度 ， 详 情 参 见 文献 L86]。 当 然 ， 标 
记 化 的 评价 也 可 以 映射 到 数值 刻度 ， 如 在 Syskill& Webert[70] 中 一 样 ， 把 用 户 对 
网 页 的 评价 划分 为 热门 、 一 般 、 冷 门 。 

。 文本 评论 : 收集 并 展示 单一 物品 的 评论 给 用 户 ， 使 其 成 为 用 户 加 快 决策 过 程 的 一 
种 方式 ， 详 情 参 见 文献 [72]。 例 如 ， 在 Amazon 或 eBay 上 ， 用 户 的 反馈 可 以 帮助 
其 他 用 户 判 断 一 件 物品 是 否 被 大 众 所 接 受 。 文 本 评论 是 有 益 的 ， 但 是 这 些 评论 也 
会 对 用 户 造成 负担 ， 因 为 她 必须 阅读 和 理解 每 条 评论 ， 并 决定 哪些 评论 是 正面 的 
哪些 是 负面 的 ， 以 及 这 些 评论 的 程度 。 文献 [71] 从 情感 计算 研究 领域 中 提出 的 先 
进 技术 ， 使 得 基于 内 容 的 推荐 系统 能 够 自动 执行 这 种 分 析 。 
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即使 数值 /符号 刻度 的 可 采纳 性 会 增加 用 户 的 认 知 负荷 ， 而 且 也 许 不 能 完全 得 到 用 户 
对 物品 的 评价 ， 显 式 反馈 仍然 具有 简单 的 优点 。 隐 式 反馈 的 方法 是 基于 对 用 户 在 某 样 物品 
上 的 特定 行为 进行 相关 性 评分 赋值 ， 如 保存 、 删 除 、 印 刷 、 收 藏 等 。 这 个 方法 的 主要 优点 
是 不 需要 用 户 的 直接 参与 ， 当 然 偏差 是 可 能 发 生 的 ， 如 在 阅读 的 时 候 被 电话 打 断 。 

为 了 建立 活路 用户 u 的 个 人 信息 ， 必 须 定义 用 户 u 的 训练 集 TR... TR, 是 一 个 成 对 
的 (I，ri) 的 集合 ， 其 中 rn 是 用 户 对 物品 描述 I, 的 评分 。 给 定 一 组 有 评分 的 物品 描述 ， 
信息 学 习 器 通过 监督 式 学 习 算法 生成 一 个 预测 模型 一 一 用 户 信息 ， 用 户 信 息 通 常 存储 在 信 
息 资源 库 里 ， 并 被 之 后 的 过 滤 组 件 所 使 用 。 给 定 一 个 新 的 物品 描述 ， 通 过 比较 存储 在 用 户 
信息 资源 库 里 的 用 户 偏好 和 表述 物品 的 特征 ， 过 滤 组 件 将 会 预测 活跃 用 户 是 否 对 它 感 兴 
趣 。 过 滤 组 件 通 常会 实现 根据 用 户 个 人 信息 相关 性 的 程度 对 潜在 感 兴趣 物品 进行 排序 的 策 
略 。 排 名 靠 前 的 物品 会 形成 一 个 推荐 列表 L。 ， 并 被 推荐 给 用 户 wu。 。 用 户 的 品味 通常 时 刻 
改变 ， 因 此 必须 维护 最 新 的 变更 ， 并 提供 给 信息 学 习 器 去 自动 更 新 用 户 个 人 信息 。 通 过 让 
用 户 表明 对 L。 中 的 物品 满意 与 否 ， 能 从 生成 的 推荐 中 收集 到 更 深层 次 的 反馈 。 在 收集 了 
这 些 反馈 后 ， 学 习 过 程 将 在 新 的 训练 数据 集 上 再 次 执行 ， 并 将 学 习 的 结果 应 用 于 生成 用 户 
的 最 新 兴趣 。 随 着 时 间 的 推移 ,“ 反 馈 一 学 习 ” 的 循环 迭代 使 得 该 系统 可 以 考虑 到 用 户 偏好 
的 动态 变化 。 


3.2.2 基于 内 容 过 滤 的 优 缺 点 


基于 内 容 的 推荐 与 基于 协同 过 滤 的 推荐 相 比 有 以 下 优点 : 

。 用 户 独 立 性 : 基于 内 容 的 推荐 仅 使 用 当前 用 户 提供 的 评分 来 构建 自己 的 个 人 信息 。 
而 协同 过 滤 的 方法 需要 其 他 用 户 的 评分 ， 来 发 现 该 用 户 最 近 的 近邻 ， 例 如 ， 由 于 
对 相同 的 物品 评分 相似 而 品味 相似 的 用 户 。 这 时 ， 只 有 当前 用 户 最 近邻 很 喜欢 的 
物品 才 有 可 能 推荐 给 当前 用 户 。 

。 透明 度 : 通过 显 式 地 列 出 使 得 物品 出 现在 推荐 列表 中 的 内 容 特 征 或 描述 ， 可 以 解 
释 推荐 系统 是 如 何 工作 的 。 这 些 物 品 特征 是 决定 是 否 信任 该 推荐 的 指标 。 相 反 ， 
协同 过 滤 系 统 是 一 个 黑 盒 子 ， 对 一 个 推荐 物品 的 唯一 解释 是 相似 品味 的 未 知 用 户 
喜欢 过 该 物品 。 

。 新 物品 : 基于 内 容 的 推荐 系统 在 没有 任何 用 户 评分 的 情况 下 也 可 以 进行 推荐 。 因 
此 ， 新 物品 没有 第 一 次 评分 会 影响 协同 过 滤 推 荐 系统 ， 因 为 协同 过 滤 推 荐 系统 仅 
依赖 于 用 户 的 偏好 产生 推荐 。 所 以 只 有 当 一 个 新 物品 被 一 系列 用 户 评分 之 后 ， 系 
统 才 可 能 推荐 它 。 

尽管 如 此 ， 基 于 内 容 的 推荐 系统 也 有 以 下 一 些 缺 点 ， 

。 可 分 析 的 内 容 有 限 : 基于 内 容 的 推荐 技术 有 一 个 天 然 的 限制 ， 即 与 推荐 对 象 相关 
的 特征 数量 和 类 型 上 的 限制 ， 不 管 是 自动 还 是 手动 的 。 领 域 知识 一 般 是 必需 的 ， 
例如 ， 对 于 电影 推荐 ， 系 统 需 要 知道 电影 的 演员 、 导 演 ， 有 时 候 领域 本 体 也 是 需 
要 的 。 当 分 析 的 物品 内 容 信 息 不 足以 区 分 哪些 物品 是 用 户 喜 欢 的 、 哪 些 物品 是 用 
户 不 喜欢 的 时 候 ， 没 有 任何 基于 内 容 的 推荐 系统 可 以 给 出 合适 的 推荐 。 有 些 解释 
只 能 获取 物品 内 容 的 某 些 方面 ， 但 是 还 有 很 多 别 的 方面 也 能 影响 用 户 体 验 。 举 个 
例子 ， 在 玩笑 或 者 诗词 里 ， 没 有 足够 的 词 频 信 息 去 为 用 户 兴 趣 建 模 ， 这 时 ， 情 感 
计算 的 技术 就 会 更 适用 。 此 外 ， 对 于 网 页 来 说 ， 文 本 特征 抽取 技术 完全 忽略 其 美 
学 特征 和 附加 的 多 媒体 信息 。 
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总 之 ， 不 论 是 手动 还 是 自动 为 物品 分 配 特征 ， 都 不 足以 定义 物品 不 同 的 特点 ， 而 这 些 
特点 被 证 明 对 提取 出 用 户 兴 趣 是 必要 的 。 
。 过 度 特 化 : 基于 内 容 的 推荐 在 本 质 上 无 法 发 现 一 些 出 人 意料 的 物品 。 系 统 建议 的 
物品 和 用 户 的 个 人 信息 高 度 匹配 的 时 候 ， 给 用 户 的 推荐 也 将 会 是 与 已 有 的 评分 物 
品 相似 的 物品 。 这 个 缺点 主要 是 由 于 基于 内 容 的 系统 产生 的 推荐 物品 在 新 颖 性 上 
的 缺陷 ， 称 作 人 惊喜 度 问题 。 举 例 来 说 ， 当 一 个 用 户 只 评价 了 Stanley Kubrick 导演 
的 电影 ， 那 么 她 得 到 的 推荐 就 只 有 这 种 类 型 的 电影 。 一 个 “完美 ”的 基于 内 容 的 技 
术 可 能 很 少 发 现任 何 新 颖 的 东西 ， 这 限制 了 使 用 它 的 应 用 程序 的 范围 。 
。 新 用 户 : 在 一 个 基于 内 容 的 推荐 系统 可 以 真正 理解 用 户 偏好 且 给 出 准确 的 推荐 之 
前 ， 需 要 收集 足够 的 评分 。 因 此 ， 当 只 有 很 少 的 评分 可 用 的 时 候 ， 即 对 于 新 用 户 
来 说 ， 系 统 不 能 提供 可 靠 的 推荐 。 
接 下 来 ， 将 就 采用 何 种 策略 来 处 理 对 上 面 提出 的 问题 ， 进 行 介绍 和 讨论 。 更 具体 地 ， 
阐述 利用 常识 和 特定 领域 的 知识 来 提高 内 容 解释 的 新 技术 (3. 3. 1. 3 节 一 3. 3. 1. 4 节 )。 通 过 提 
供 新 的 特征 可 能 有 助 于 克服 传统 的 内 容 分 析 方式 的 限制 ， 如 WordNet[60，32] 或 Wikipedia 
念 ， 帮 助 物品 用 一 种 更 准确 透明 的 方式 进行 推荐 。 此 外 ， 将 推荐 过 程 中 用 户 定义 词典 ， 如 
大 众 分 类 ， 作 为 扩展 词 表 加 入 考虑 并 进行 整合 的 过 程 ， 将 在 3. 4. 1 节 进 行 介绍 。 
使 用 惊喜 度 推荐 ， 即 新 颖 性 很 高 的 用 户 感 兴趣 的 物品 ， 来 满足 用 户 的 可 能 方式 将 作为 
解决 过 度 特 化 问题 的 解决 方案 进行 分 析 (3. 4. 2 节 ) 。 
最 后 ， 将 会 介绍 克服 新 用 户 问题 的 各 种 不 同 策略 。 其 中 ， 当 在 特定 用 户 的 评分 很 少 或 
者 没有 的 情况 下 推荐 时 ， 社 区 用 户 所 提供 的 社交 标签 可 以 作为 推荐 的 反馈 应 用 到 系统 中 
(8.4.1.1 $3, 


3.3 基于 内 容 的 推荐 系统 的 现状 


顾名思义 ， 基 于 内 容 的 推荐 是 利用 物品 的 内 容 数 据 来 预测 它 和 用 户 个 人 信息 的 相关 
性 。 基 于 内 容 的 推荐 系统 的 研究 涉及 计算 机 科学 的 许多 方面 ， 尤 其 是 在 信息 检索 L6] 和 人 
工 智能 领域 。 

在 信息 检索 领域 ， 推 荐 技术 研究 的 想象 力 来 自 将 用 户 搜索 推荐 结果 看 作 一 个 信息 检索 
的 过 程 。 在 信息 检索 系统 中 ， 用 户 需 要 给 出 一 次 性 查询 信息 (经 常 是 一 个 关键 词 列表 )， 而 
在 信息 过 滤 系 统 ， 用 户 的 信息 需求 被 表示 成 他 的 个 人 信息 。 由 于 用 来 描述 物品 的 属性 在 数 
量 和 类 型 上 的 差异 ， 待 推荐 物品 也 会 有 较 大 差异 。 每 个 物品 当然 可 以 用 一 组 已 知 数值 的 少 
量 相同 的 属性 来 表示 ， 但 是 这 种 方法 不 是 非常 合适 如 Web 网 页 、 新 闻 、 电 子 邮 件 或 者 文 
档 等 非 结构 化 数据 表示 的 对 象 。 在 这 种 属性 值 未 明确 定义 的 情况 下 ， 基 于 信息 检索 研究 的 
文档 模型 技术 更 有 用 。 

从 人 工 智能 的 观点 出 发 ， 推 荐 任务 可 以 被 映射 成 一 个 利用 用 户 过 去 知识 来 学 习 的 学 习 
问题 。 最 简单 地 ， 用 户 的 个 人 信息 形式 为 用 户 指定 的 关键 词 或 准则 ， 它 反映 了 用 户 长 期 的 
兴趣 。 往 往 建议 系统 学 习 用 户 个 人 信息 ， 而 不 是 强迫 用 户 自己 提供 。 这 就 广泛 应 用 了 机 器 
学 习 技术 ， 其 目标 是 基于 过 去 已 知 并 被 用 户 显 式 或 隐 式 地 标记 为 是 否 感 兴趣 的 信息 ， 来 学 
习 分 类 新 物品 。 给 定 这 些 已 标记 的 物品 信息 ， 机 器 学 习 的 方法 能 够 生成 一 个 预测 模型 ， 可 
以 帮助 判断 目标 用 户 对 给 定 新 物品 是 否 感 兴趣 。 

3.3.1 节 阐 述 了 多 个 物品 信息 表示 技术 ， 从 传统 的 文本 表示 ， 到 整合 了 本 体 和 百科 全 
书 式 知识 等 更 先进 的 技术 。3. 3. 2 节 讨 论 了 适合 上 面 描述 的 表示 方法 的 推荐 算法 。 
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3.3.1 物品 表示 


推荐 给 用 户 的 物品 可 以 表示 成 一 系列 特征 ， 也 称 为 属性 (attribute 或 property)。 例 
如 ， 在 一 个 电影 推荐 的 应 用 中 ， 描 述 一 个 电影 的 特征 有 演员 、 导 演 、 类 型 、 主 题 等 。 当 每 
个 物品 由 一 系列 相同 的 属性 表示 ， 并 且 知 道 这 些 属性 所 有 可 能 的 取 值 时 ， 该 物品 就 被 表示 
成 了 结构 化 数据 。 在 此 情况 下 ， 许 多 机 器 学 习 的 算法 可 以 用 来 学 习 用 户 个 人 信息 [69]。 

在 大 多 数 基 于 内 容 过 滤 的 系统 ， 物 品 表 示 是 从 Web 网 页 、 电 子 邮件 、 新 闻 或 产品 描 
述 中 抽取 的 文本 特征 。 不 像 结 构 化 数据 ， 它 们 没有 明确 定义 的 属性 。 由 于 自然 语言 的 歧 
义 ， 在 学 习 用 户 个 人 信息 时 ， 文 本 特征 带 来 大 量 混 乱 。 问 题 是 传统 的 基于 关键 词 的 个 人 信 
息 不 能 获取 用 户 兴 趣 的 语义 ， 因 为 他 们 主要 是 通过 字符 串 匹 配 操作 来 进行 的 。 如 果 一 个 字 
符 串 或 者 某 些 语法 变量 同时 在 个 人 信息 和 文档 中 被 发 现 ， 那 么 匹配 就 成 功 ， 文 档 就 被 认为 
是 相关 的 。 字 符 串 匹配 有 如 下 问题 : 

。 一 词 多 义 ， 一 个 词 有 多 个 释义 。 

。 同 义 ， 多 个 词 有 相同 的 意思 。 

导致 的 结果 就 是 ， 由 于 同义词 的 存在 ， 当 个 人 信息 不 包含 文档 中 的 准确 关键 词 时 ， 相 
关 的 信息 就 会 遗漏 ; 同时 由 于 一 词 多 义 ， 错 误 的 文档 也 被 认为 是 相关 的 。 

语义 分 析 及 其 与 个 性 化 模型 的 结合 是 文献 中 提 到 的 最 具有 创新 性 和 最 有 趣 的 解决 问题 
的 方法 之 一 。 主 要 的 思路 是 采用 知识 库 ， 如 词典 或 本 体 ， 来 注释 物品 和 表示 个 人 信息 ， 由 
此 获得 一 个 用 户 信 息 所 需 的 语义 翻译 。 在 3. 3. 1. 1 节 ， 先 回顾 一 个 依赖 于 该 模型 的 “传统 ” 
系统 ， 之 后 将 介绍 基于 本 体 论 和 世界 知识 的 语义 分 析 技 术 。 
3.3.1.1 基于 关键 字 向 量 空间 模型 

大 多 数 基于 内 容 的 推荐 系统 使 用 相对 简单 的 检索 模型 ， 例如， 关键 字 匹 配 或 者 基于 
TF-IDF 权重 的 向 量 空间 模型 (Vector Space Model，VSM)。 向 量 空间 模型 是 一 个 文本 文 
档 的 空间 表示 方法 。 在 该 模型 中 ， 每 个 文档 被 表示 成 一 个 n 维 空间 中 的 向 量 ， 每 一 维 对 应 
给 定 文档 集合 词汇 表 中 的 一 个 词 。 形 式 上 ， 每 篇 文档 被 表示 成 词 权 重 的 向 量 ， 其 中 权重 表 
示 这 篇 文档 和 该 词 的 关联 度 。 让 D— (di, do» ，…，dN)} 表 示 一 个 文档 集合 或 语料库 ， 了 = 
{1，ts，*…，ty) 表 示 词 典 ， 即 语料库 中 词 的 集合 。 词 典 工 从 某 些 标准 的 自然 语言 处 理 操 
作 中 获取 ， 如 分 词 、 停 用 词 移 除 、 变 形 [6]。 每 篇 文档 d; 表示 为 n 维 向 量 空 间 上 的 一 个 向 
量 ， 从 而 dj =(wi;> Was °°» Wj} 其 中 wy 是 文档 d; 中 词 如 的 权重 。 

在 向 量 空间 模型 中 ， 文 档 表 示 有 两 个 问题 : 为 单词 赋予 权重 和 度量 特征 向 量 的 相似 
度 。 常 用 的 加 权 模 式 有 基于 文本 实验 观察 结果 的 TF-IDF( 词 频 一 逆 文 档 频率 )L79]; 

。 稀有 词 相关 性 不 小 于 频繁 词 相关 性 ( 逆 文 档 频 率 假设 ); 

。 一 篇 文档 中 多 处 出 现 的 词 的 相关 性 不 小 于 只 出 现 一 次 词 的 相关 性 ; 

。 长 文档 不 一 定好 于 短文 档 ( 归 一 化 假设 ) 。 

换 句 话说 ， 在 一 篇 文档 中 频繁 出 现 (TF 三 词 频 ) 但 很 少 出 现在 语料库 中 其 他 的 文档 里 
(IDF 王 道 文档 频率 ) 的 单词 ， 与 该 文档 主题 的 相关 性 可 能 很 大 。 另 外 ， 结 果 权 重 向 量 的 归 
一 化 防止 了 长 文档 有 更 好 的 检索 机 会 的 问题 。TF-IDF 函数 很 好 地 解释 了 这 些 假设 : 


TF-IDF (ti,d;) = TF(t ;yd;) + log ix (3: 1) 
coc Mel 0, 
rm 


TE 
IDF 


N 表示 语料库 中 文档 的 个 数 ，n, 表示 含有 词 单词 出 现 至 少 一 次 的 文档 集合 的 数量 。 
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二 (3. 2) 


max, f ..; 

最 大 值 是 出 现在 文档 d 中 所 有 单词 1. 的 词 频 f., 上 计算 的 。 为 了 使 权重 落 在 [0，1] 区 间 

且 文 档 能 够 用 等 长 向 量 表 示 ， 利 用 式 (3. 1) 获 取 权 重 通常 用 余弦 归 一 化 方式 来 归 一 化 : 
TF-IDF(t, ,d;) 


| 5) TF-IDF (2, d; 
其 实现 了 归 一 化 的 假设 。 | 


如 前 所 述 ， 一 个 相似 度 的 度量 需要 先 确定 两 个 文档 的 接近 程度 。 许 多 相似 度 的 度量 都 
衍生 于 对 两 个 向 量 的 接近 程度 的 度量 ;在 这 些 度量 中 ， 余 弦 相 似 度 被 广泛 应 用 : 


> Wry * Wry 
k 


[Swe [Sy 

在 依赖 于 向 量 空间 模型 的 基于 内 容 的 推荐 系统 中 ， 用 户 个 人 信息 和 物品 都 被 表示 成 带 
权重 的 词 向 量 。 预 测 用 户 对 一 个 特定 物品 的 兴趣 可 以 通过 计算 余弦 相似 度 得 到 。 

3. 3. 1.2 基于 关键 词 系统 概述 

许多 基于 关键 词 的 推荐 系统 发 展 时 间 相 对 较 短 ， 但 在 很 多 领域 都 可 以 发 现 它们 在 应 用 
程序 中 的 应 用 ， 如 新 闻 、 音 乐 、 电 子 商务 、 电 影 等 。 每 个 领域 面 对 不 同 的 问题 ， 也 就 需要 
不 同 的 解决 方案 。 

在 Web 推荐 系统 的 领域 中 ， 关 于 内 容 的 著名 系统 有 Letizia[49]. Personal Web- 
Watcher[62，63]、Syskill&Webert[70，68]、ifWeb[4]、Amalthea[66] 和 WebMate 
[23]. Letizia 是 一 个 网 页 浏览 器 的 扩展 ， 它 跟踪 用 户 浏览 行为 ， 并 依据 与 用 户 兴趣 相关 的 
关键 词 进行 个 性 化 建 模 。 它 依赖 隐 式 反馈 来 推断 用 户 的 喜好 。 例 如 ， 收 藏 一 个 网 页 就 表示 
为 用 户 对 这 个 网 页 感 兴趣 的 有 力 证 据 。 同 样 的 方式 , 个 人 WebWatcher 从 用 户 访问 的 网 页 
和 离开 已 访问 网 页 的 链接 来 学 习 个 体 的 兴趣 。 它 将 访问 的 网 页 作为 用 户 兴趣 的 正 例 ， 未 访 
问 的 网 页 作为 负 例 。Amalthea 使 用 指定 的 过 滤 工 具 来 协助 用 户 发 现 感 兴趣 的 信息 。 用 户 
可 以 通过 提供 与 用 户 兴 趣 相 关 的 网 页 (表示 为 权重 向 量 ) 来 确定 过 滤器 。 

Syskill & Webert 采用 了 相同 的 方法 ， 它 用 128 个 最 有 代表 性 的 词 ( 文 档 中 有 代表 性 
的 词 可 以 用 许多 不 同 的 方法 确定 ) 来 表示 文档 。ifWeb 采用 了 更 高 级 的 表示 技术 ， 它 将 信 
息 表 示 成 一 定形 式 的 带 权重 的 语义 网 。 它 支持 显 式 反 馈 ， 并 且 不 仅 考 虑 兴趣 ， 而 且 还 考虑 
了 显 式 的 非 兴 趣 。 另 一 个 有 趣 的 方面 是 ， 它 加 入 了 一 个 时 间 误 减 的 机 制 ， 如 给 表示 用 户 的 
兴趣 加 上 时 间 衰 减 。WebMate 采用 了 另 一 个 不 同 的 方法 来 表示 用 户 兴趣 ， 它 在 不 同 领域 
通过 学 习 由 正 向 训练 样 例 表 示 的 关键 词 向 量 构 成 的 用 户 信 息 来 跟踪 用 户 兴趣 。 一 个 n 个 关 
键 词 的 向 量 可 以 正确 地 表示 最 多 nn 个 独立 的 用 户 兴 趣 。 

在 新 闻 过 滤 领 域 ， 著 名 的 推荐 系统 有 NewT[87]. PSUN[90], INFOrmer[ 91], 
NewsDude[12]、Daily Learner[13] 和 YourNews[2]. NewT(News Tailor) 允许 用 户 提 供 
关于 文章 、 部 分 章节 、 作 者 或 来 源 的 显 式 和 隐 式 反馈 。 许 多 过 滤 工 具 用 不 同类 型 的 信息 进 
行 训练 ， 如 政治 类 新 闻 过 滤器 、 体 育 类 新 闻 过 滤器 等 。YourNews 是 一 个 最 近 新 出 现 的 个 
性 化 新 闻 访 问 系统 ， 使 用 同样 的 方法 为 8 个 不 同 主题 (国内 、 国 际 、 经 济 等 ) 分 别 维护 有 一 
个 兴趣 个 人 信息 。 用 户 对 这 些 主题 的 兴趣 信息 用 一 个 加 权 的 原型 词 向 量 表 示 ， 向 量 值 从 用 
户 浏览 的 新 闻 的 历史 记录 中 抽取 。 用 户 过 去 浏览 了 N 篇 文章 ， 抽 取 前 100 个 加 权 了 的 词 


(3. 3) 


Wj = 


sim(d;,d;) = (3. 4) 


58 PAT 基础 技术 





来 生成 用 户 最 终 的 原型 向 量 。 该 系统 维护 了 一 个 仅 考虑 最 近 浏 览 过 的 20 篇 新 闻 信 息 的 短 
期 特征 ， 而 长 期 特征 考虑 的 是 过 去 所 有 浏览 过 的 新 闻 。 系 统 可 以 利用 这 些 个 人 信息 来 显示 
最 近 的 和 推荐 的 两 类 新 闻 。 9 

在 新 闻 过 滤 系 统 中 ， 学 习 短 期 和 长 期 特征 是 两 种 非常 典型 的 方式 。NewsDude 在 用 户 
提供 的 感 兴趣 新 闻 的 初始 训练 集 基 础 上 ， 用 基于 TF-IDF (余弦 相似 度 ) 的 方法 学 习 用 户 短 
期 模型 ， 用 基于 朴素 贝 叶 斯 分 类 器 的 模型 学 习 用 户 的 长 期 模型 。 新 闻 来 源 于 雅虎 新 闻 。 同 
样 的 Daily Learner 无 线 信 息 访问 的 学 习 工 具 ， 也 采用 一 种 方法 来 学 习 两 种 不 同 的 用 户 模 
型 。 前 者 基于 最 近邻 的 文本 分 类 器 算法 来 维护 用 户 的 短期 兴趣 特征 ， 后 者 利用 长 时 间 收 集 
到 的 数据 ， 基 于 朴素 贝 叶 斯 分 类 器 ， 来 学 习 用 户 的 长 期 兴趣 特征 。 

在 对 文章 和 个 人 信息 使 用 更 复杂 表示 的 系统 中 ， 需 要 注意 PSUN 和 INFOrmer, 
PSUN 采用 了 一 个 可 选择 的 文本 表示 方法 。 初 始 特征 由 系统 中 用 户 选择 感 兴趣 的 某 些 文章 
来 提供 。 文 本 中 重复 出 现 的 单词 被 记录 在 称 为 n-gams 的 网 络 中 ， 这 个 网 络 中 的 单词 可 以 
相互 吸引 或 者 排斥 ， 相 互 吸引 程度 主要 取决 于 网 络 中 两 个 词 共 同 出 现 的 次 数 。 每 个 用 户 都 
有 多 个 特征 ， 它 们 是 需要 显 式 反馈 ， 经 过 一 个 遗传 算法 来 竞争 产生 的 。INFOrmer 使 用 一 
个 语义 网 络 来 同时 表示 用 户 特 征 和 文本 。 一 个 扩散 激活 技术 [25] 用 来 比较 文本 和 用 户 特 
征 ， 并 且 为 使 系统 行为 适应 变化 的 用 户 兴 趣 ， 采 用 一 个 相关 的 反馈 机 制 。 一 个 纯 扩 散 激活 
模型 是 由 被 标记 或 加 权 的 链接 起 来 的 节点 组 成 的 数据 网 络 。 给 一 组 源 节点 标记 激活 权重 ， 
然后 不 断 和 迭代 ， 将 源 节点 激活 权重 传播 给 与 它 相 连 的 其 他 节点 ， 直 到 终止 条 件 满足 使 得 网 
络 中 的 搜索 过 程 结束 。 

各 种 不 同 的 基于 内 容 的 推荐 系统 在 其 他 的 应 用 领域 也 有 应 用 。LIBRA[65] 做 的 书籍 推 
荐 ， 利 用 从 Amazon 在 线 电 子 商店 获取 的 关于 产品 描述 的 网 页 ， 实 现 了 一 个 朴素 贝 叶 斯 文 
本 分 类 方法 。Re: Agentl16]: 智能 的 电子 邮件 工具 ， 它 利用 自动 的 特征 抽取 算法 ， 可 以 
学 习 如 过 滤 、 下 载 到 掌上 电脑 、 将 邮件 转 为 语音 邮件 等 行为 。Re: Agent 用 户 只 需要 将 样 
例 信息 放 置 在 与 期 望 行为 对 应 的 文件 夹 中 。Re: Agent 从 这 些 文件 夹 中 学 习 概 念 和 决策 策 
略 。Citeseer[15] 通 过 使 用 文字 信息 和 分 析 论文 中 的 共同 引文 ， 来 协助 用 户 搜索 学 术 文献 。 
INTIMATE[53] 使 用 文本 分 类 技术 从 Internet Movie Databasee 获 得 的 电影 剧情 简介 去 学 
习 ， 进 而 推荐 电影 。 为 了 获得 推荐 电影 ， 用 户 被 要 求 至 少 给 一 定数 量 的 电影 进行 评价 ， 评 
价 分 为 6 个 档次 : 很 差 、 差 、 低 于 平均 、 高 于 平均 、 好 、 优 秀 。 同 样 ，Movies2GOL67] 从 
用 户 评 分 过 的 电影 剧情 简介 中 学 习 用 户 偏 好 。 该 系统 的 创新 之 处 是 加 入 了 投票 模式 [93]， 
当 多 人 在 偏好 上 有 冲突 的 时 候 ， 给 一 个 可 接受 的 折 中 ， 使 他 们 的 冲突 偏好 能 更 好 地 适应 单 
AAP. 

在 音乐 领域 ， 一 般 使 用 的 推荐 技术 是 协同 过 滤 ( 见 Last. fm 日 和 MyStrands® 系 统 )。 最 
著名 的 系统 Pandora® 使 用 (人 工 的) 基于 内 容 的 描述 来 推荐 音乐 。 该 系统 的 主要 问题 是 可 
扩展 性 ， 因 为 音乐 注释 的 过 程 全 是 靠 人 工 完 成 的 。 相 反 ，FOAFing the music[21，22] 可 
以 推荐 音乐 、 发 现 音 乐 和 探索 音乐 的 内 容 ， 它 基于 来 自 Friend of a FriendC(FOAF@ ) 的 用 
户 信息 、 从 与 音乐 相关 的 RSS 种 子 中 提取 的 上 下 文 信息 ， 以 及 自动 地 从 音频 文件 中 提取 


这 里 的 “recent and recommended” 应 该 表示 的 是 两 种 推荐 的 形式 。 一 一 译 者 注 
http: // www. imdb. com 

http: // www. last. fm 

http://www. mystrands. com 

http://www. pandora. com 

http://www. foaf-project. org 
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的 基于 内 容 的 描述 。 

为 了 完成 采用 简单 的 关键 字 向 量 空间 表示 的 基于 内 容 的 推荐 系统 的 研究 ， 我 们 也 会 提 
到 一 些 融 合 了 协同 和 基于 内 容 的 方法 的 混合 推荐 系统 ， 如 Fabl7], WebWacther[45], 
ProfBuilder[99], PTV[89]. Content-boosted Collaborative Filtering[ 56], CinemaScreen 
[78] 和 在 文献 L[94] 中 提 到 的 一 个 。 

对 过 去 15 年 里 主流 系统 的 发 展 进行 分 析 学 习 ， 最 重要 的 发 现 是 ， 同 时 对 物品 和 用 户 
信息 采用 基于 关键 词 的 表示 ， 并 通过 足够 多 的 信息 证 明 用 户 兴 趣 可 用 ， 可 以 准确 预测 用 户 
行为 。 大 多 数 基 于 内 容 的 系统 被 认为 是 建立 在 包括 用 户 兴 趣 正 例 和 负 例 文本 训练 集 上 的 文 
本 分 类 器 。 因 此 推荐 的 准确 率 依 赖 于 大 量 的 训练 样本 ， 而 训练 样本 的 好 坏 又 依赖 于 对 用 户 
兴趣 的 可 靠 的 句法 分 析 的 结果 。 这 个 方法 的 问题 就 是 “缺乏 智能 2?。 当 要 求 更 高 级 的 特性 
时 ， 基 于 关键 词 的 方法 就 显得 不 足 。 如 果 用 户 有 个 如 “法国 印象 派 ” 的 关键 词 ， 基 于 关键 词 
的 方法 只 能 找 出 包含 有 词 “法 国 ”" 和 “印象 派 ” 的 文档 。 那 么 关于 Claude Monet 或 Renoir 展 
览 的 文档 将 不 会 出 现在 推荐 集合 中 ， 即 使 他 们 可 能 对 用 户 来 说 更 相关 一 些 。 更 高 级 的 表示 
策略 需要 为 基于 内 容 的 推荐 系统 添加 “语义 智能 ”， 它 可 以 超越 由 关键 词 提 供 的 用 户 兴 趣 的 
语法 证 据 。 

下 面 将 会 探究 在 索引 阶段 通过 本 体 和 广博 知识 源 注 入 知识 的 可 能 方式 。 
3.3.1.3 运用 本 体 的 语义 分 析 

语义 分 析 需 要 学 习 大 量 准 确 的 信息 ， 这 些 信息 包括 参考 在 外 部 知识 基础 上 定义 的 概 
念 。 这 个 方法 的 主要 的 目 是 提供 一 个 有 文化 和 语言 背景 知识 的 推荐 系统 ， 且 系统 具有 翻译 
自然 语言 文档 和 分 析 内 容 的 能 力 。 

本 节 将 会 介绍 一 些 现在 主流 策略 里 所 采用 的 语义 推荐 过 程 。 这 些 策略 大 致 主要 考虑 以 
下 几 个 标准 : 

。 包含 知识 源 的 类 型 (如 词典 、 本 体 等 ); 

。 物品 的 注释 或 表示 所 采用 的 技术 ; 

。 用 户 个 人 信息 中 内 容 的 类 型 ; 

。 物品 -用 户 个 人 信息 匹配 策略 。 

SitelFL52] 是 一 个 多 语言 新 闻 网 站 的 个 性 化 的 工具 。 为 了 最 好 地 表示 知识 ， 这 是 第 一 
个 采用 基于 感知 的 文档 表示 来 对 用 户 兴趣 建 模 的 系统 。MaultiWordNet 是 一 个 在 表示 过 程 
包括 外 部 知识 源 的 系统 和 一 个 集合 了 英语 和 意大利 语 的 多 语言 词汇 数据 库 。 每 篇 新 闻 会 使 
用 词 领域 消 歧 (Word Domain Disambiguation)[51] 来 自动 关联 到 一 个 MultiWordNet 的 同 
义 词 集 合 。 用 户 信息 是 来 自 于 用 户 读 过 的 文档 中 发 现 的 语义 网 络 中 某 节点 表示 的 同义词 集 
合 。 在 匹配 阶段 ， 系 统 将 文档 的 同义词 表示 集合 和 当前 用 户 模 型 作为 输入 ， 将 使 用 语义 网 
络 数值 技术 (Semantic Network Value Technique)[92] 产 生 的 相关 文档 作为 预测 输出 。 

ITR(Item Recommender) 是 一 个 可 以 在 多 个 领域 应 用 的 物品 推荐 系统 (如 电影 、 音 乐 、 
书籍 ) ， 它 以 文本 的 形式 提供 了 对 物品 的 描述 (如 情节 摘要 、 概 述 、 短 摘要 )[27，83]。 和 
SiteIF 相似 ，ITR 在 学 习 用 户 信息 的 过 程 中 集合 了 多 语言 知识 ， 但 是 与 词 领域 消 歧 不 同 ， 
词 感知 消 歧 (Word Sense Disambiguation) 采 取 的 是 基于 感知 的 文档 表示 。 多 语言 知识 不 包 
含 来 自 于 WordNet 词汇 的 本 体 。 物 品 根据 一 个 基于 同义词 集合 的 向 量 空间 模型 进行 表示 ， 
Ti E SZ ia] 48 (Bags-of-Synsets, BOS), EE Jt H is] 49 i 79 (Bags-of-Words, BOW) ff 
— 7 (8, 84]. Æ BOS 模型 中 ， 同 义 词 集合 向 量 不 是 像 一 个 词 向 量 对 应 一 篇 文档 一 
样 。 用 户 信息 采用 一 个 朴素 贝 叶 斯 二 进 制 文本 分 类 器 可 以 将 文本 分 类 成 感 兴趣 和 不 感 兴 
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趣 。 在 训练 阶段 ， 根 据 条 件 概率 估计 值 ， 可 以 得 到 更 能 象征 用 户 偏好 的 那些 同义词 集合 。 
文本 一 用 户 信 息 匹 配 操作 在 于 通过 使 用 用 户 信 息 的 同义词 集合 的 概率 ， 计 算 物 品 属于 “ 感 
兴趣 ”类 的 概率 。 

SEWeP(Semantic Enhancement for Web Personalization， 用 于 Web 个 性 化 的 语义 增 
强 )[31] 是 一 个 Web 个 性 化 系统 ， 它 利用 日 志和 Web 站 点 内 容 的 语义 来 实现 个 性 化 。 为 
得 到 统一 一 致 的 词汇 表 ， 采 用 了 特定 领域 的 类 别 分 类 对 网 页 进行 语义 标注 。 类 别 是 人 工 建 
立 的 ， 而 标注 的 过 程 是 自动 完成 的 。SEWeP， 像 SitelF 和 ITR 一 样 ， 利 用 WordNet 中 的 
闻 典 知识 ， 来 “翻译 ”文本 的 内 容 并 支持 标注 /表示 的 过 程 。 网 页 最 初 被 表示 成 从 其 内 容 中 
抽取 的 关键 词 ， 然 后 这 些 关键 词 被 映射 到 类 别 中 的 概念 。 给 定 一 个 关键 词 ， 基 于 WordNet 
中 词 的 相似 度 度 量 ， 用 来 找 出 与 这 个 关键 词 “ 最 近 " 的 类 别 的 词 。SEWeP 不 会 给 用 户 创建 
个 性 化 信息 ， 而 是 发 现 一 种 导航 模式 。SEWeP 的 推荐 引擎 利用 与 一 个 模式 有 "语义 关联 ?” 
的 类 别 来 扩展 个 性 化 网 页 推荐 集合 ， 这 个 类 别 可 能 就 是 用 户 感 兴趣 的 主题 分 类 。 

Quickstep[58] 是 一 个 在 线 学 术 研 究 论文 的 推荐 系统 。 该 系统 是 根据 网 站 DMOZ 上 的 
开源 目录 工程 S(27 个 类 别 ) 的 计算 机 科学 分 类 来 抽取 党 术 研 究 论 文 主 题 的 本 体 ， 运 用 k- 
NN 分 类 器 结合 论文 的 语义 标注 与 研究 论文 主题 本 体 。 用 户 的 兴趣 信息 从 之 前 浏览 的 研究 
论文 所 属 分 类 的 关联 计算 得 到 。 因 此 ， 用 户 兴趣 特征 就 是 一 组 主题 及 主题 的 兴趣 值 。 物 
品 一 用 户 特 征 匹 配 通 过 计算 用 户 个 人 信息 和 被 分 为 该 类 的 论文 的 前 三 个 感 兴趣 的 主题 来 实 
现 。 除 了 网 页 推荐 界面 ，Foxtrot[58] 通 过 实现 论文 查询 接口 、 个 人 信息 可 视 化 接口 和 邮 
件 提醒 来 扩展 Quickstep 系统 。 特 征 被 表示 成 一 组 用 户 可 以 理解 的 本 体 ， 使 用 户 特征 可 视 
化 成 为 可 能 。 

Informed Recommender[ 1] 使 用 消费 者 产品 评价 给 出 推荐 建议 。 系 统 通过 作为 知识 表 
示 和 共享 的 翻译 本 体 ， 把 用 户 观 点 转换 成 一 个 结构 化 形式 。 本 体 提供 了 一 个 可 控 的 词 表 及 
要 描述 的 词 与 词 的 关系 ， 消费 者 的 专业 水 平 及 对 被 评论 的 产品 的 使 用 经 验 。 为 了 这 个 目 
的 ， 本 体 主要 包含 了 两 部 分 : 观点 的 质量 和 产品 的 质量 ， 由 此 形成 了 两 个 形式 化 概念 。 一 
个 文本 控 握 过 程 自 动 地 将 评价 中 的 句子 映射 到 本 体 信 息 结构 。 该 系统 不 会 为 用 户 建立 特 
征 ， 而 是 基于 用 户 请 求 计 算 推 荐 集 ， 如 用 户 对 产品 特定 特征 的 质量 有 所 要 求 。Informed 
Recommender 可 以 响应 这 个 查询 ， 并 且 可 以 根据 用 户 关心 的 特征 属性 推荐 最 好 的 产品 。 
值得 注意 的 两 个 方面 ， 一 个 是 本 体 知识 可 以 根据 产品 的 标注 对 不 同 观 点 建 模 ， 另 一 个 是 用 
户 的 评价 描述 是 以 自由 文本 的 形式 。 

News@hand[18] 是 一 个 采用 基于 本 体 表示 物品 特征 和 用 户 偏 好 来 推荐 新 闻 的 系统 。 标 
注 过 程 将 新 闻 和 所 局 领域 的 本 体 联 系 起 来 。 他 们 采用 IPTCS 囊 括 了 多 个 领域 的 共 17 个 本 
体 库 ， 如 教育 、 文 化 、 政 治 、 宗 教 、 科 学 、 体 育 等 。 但 并 不 清楚 它 是 用 人 工 还 是 用 像 文本 
分 类 一 样 的 自动 化 技术 进行 标注 的 。 物 品 的 表示 是 定义 在 本 体 概念 空间 的 TF-IDF 得 分 的 
向 量 。 用 户 特 征 也 用 相同 的 空间 进行 表示 ， 但 分 值 度量 的 是 用 户 对 特定 概念 的 兴趣 强度 。 
物品 一 用 户 特 征 匹 配 通 过 计算 向 量 的 余弦 相似 度 得 到 。 

之 前 提 到 过 的 推荐 系统 Interactive Digital Television[14]， 借 鉴 语 义 网 的 合理 技术 来 比 
较 用 户 偏 好 和 物品 (电视 节目 )， 比 传统 的 语义 指标 更 有 弹性 。 在 推荐 过 程 中 可 用 的 电视 节 
目 使 用 能 够 正确 描述 其 主要 属性 的 元 数据 进行 标注 。 电 视 领 域 的 知识 和 用 户 特 征 都 采用 


© http://www. dmoz. org/ 
© http, //nets. ii. unm. es/neptuno/iptc/ 
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OWL 本 体 来 表示 。 本 体 一 用 户 特 征 给 出 了 用 户 偏好 的 表示 ， 可 以 找 出 偏好 的 原因 ， 也 可 
以 发 现 跟 用 户 兴趣 有 关 的 额外 知识 。 推 荐 阶段 采用 存储 在 用 户 特征 中 的 知识 来 发 现 隐藏 在 
用 户 偏好 和 产品 之 间 的 语义 关联 。 知 识 推理 的 过 程 和 扩散 激活 技术 被 应 用 在 给 用 户 建议 产 
品 。 这 项 工作 值得 注意 的 方面 是 ， 基 于 扁平 列表 的 方式 不 是 良好 结构 化 的 数据 ， 本 体 一 用 
户 特征 改进 了 这 种 方式 ， 帮 助 发 现 新 的 知识 。 

JUMP 系统 [10，9j] 可 以 智能 地 将 基于 情景 的 和 个 性 化 的 信息 发 送 给 日 常 工作 环境 中 
做 着 非常 规 工作 的 知识 工程 师 。JUMP 用 户 的 信息 需求 被 表示 成 复杂 的 查询 ， 查 询 可 以 是 
一 个 任务 支撑 需求 ， 而 不 是 一 个 用 户 信息 。 比 如 ， 一 个 复杂 的 查询 例子 “我 需要 准备 一 个 
VIKEF 工程 的 技术 报告 "。 同 时 对 文档 和 用 户 需 求 信 息 进行 语义 分 析 ， 是 基于 其 中 概念 是 
通过 WordNet 同义词 集合 进行 手工 标注 的 领域 本 体 。 而 从 文档 到 领域 或 词典 概念 的 映射 
是 通过 词 感知 消 歧 和 命名 实体 识别 自动 完成 的 ， 其 中 在 领域 本 体 中 使 用 了 词典 标注 。 而 用 
户 需 求 的 概念 和 文档 的 概念 匹配 是 根据 他 们 在 领域 本 体 中 的 联系 。 在 前 面 的 查询 例子 中 ， 
概念 “技术 报告 "和 “工程 ”的 实体 及 实体 之 间 的 关系 都 是 从 本 体 中 提取 的 。 

WordNet 采用 了 语义 消 歧 技术 ， 经 常用 在 语义 翻译 上 ， 而 由 于 其 广泛 使 用 ， 语 言 知识 
的 领先 地 位 越 来 越 突出 。 另 一 方面 ， 上 述 研究 表明 ， 仅 有 WordNet 所 带 来 的 巨大 潜力 还 
不 足以 理解 用 户 兴 趣 以 及 应 用 领域 中 兴趣 的 上 下 文 。 特 定 领 域 的 知识 是 必需 的 。 本 体 是 应 
用 领域 形成 的 基础 ， 用 于 领域 中 的 物品 的 语义 描述 、 概 念 (如 类 别 及 其 实例 ) 的 表示 、 关 系 
(如 层次 关系 、 属 性 ) 的 定义 中 。 总 之 ， 相 比 于 传统 的 基于 内 容 的 方法 ， 不 管 是 囊括 了 语言 
还 是 特定 领域 知识 ， 抑 或 是 基于 内 容 的 过 滤 方 法 的 研究 ， 都 提供 了 更 好 、 更 准确 的 推荐 结 
果 。 这 也 鼓励 了 研究 人 员 利 用 像 主题 词 表 或 本 体 一 样 的 外 部 知识 形式 化 用 户 兴 趣 并 将 其 置 
于 上 下 文中 ,来 设计 研究 用 户 兴趣 的 新 颖 的 过 滤 方 式 。 
3.3.1.4 运用 百科 全 书 式 的 知识 源 进行 语义 分 析 

相 比 于 只 有 很 多 词 的 集合 ， 常 识 和 特定 领域 知识 产生 更 有 信息 量 的 特征 ， 对 于 改进 自 
然 语 言 处 理 技术 可 能 会 有 帮助 。 在 学 习 用 户 特征 的 过 程 中 ， 相 对 于 经 典 的 使 用 内 因 知 识 的 
技术 ， 注 入 外 因 知 识 ( 外 部 提供 的 ) 得 到 的 效果 会 更 好 。 近 些 年 来 ， 世 界 上 很 多 的 知识 信息 
源 已 经 变 得 容易 获取 。 举 例 来 说 ， 开 放 目 录 工 程 (Open Directory Project, ODP), Yahoo! 
Web Directory、Wikipedia 都 是 通用 的 知识 库 。 

接 下 来 简单 地 回顾 下 利用 通用 知识 产生 新 的 高 级 特征 的 新 方法 ， 即 使 其 中 有 些 方法 在 
学 习 用 户 特征 的 情景 中 并 没有 被 使 用 。 

显 式 语义 分 析 (Explicit Semantic Analysis，ESA)[34，35] 技 术 利 用 Wikipedia 中 的 概 
念 将 自然 语言 文本 表示 成 细 粒 度 的 语义 概念 。Wikipedia 的 文章 定义 了 概念 ， 如 Italy. ib 
算 机 科学 、 推 荐 系统 。 这 类 方法 是 受 增 加 对 大 量 客观 世界 知识 进行 文本 表示 的 需求 而 产生 
的 。 将 Wikipedia 作为 知识 源 有 几 个 好 处 ， 如 社区 成 员 的 不 断 完善 、 有 多 种 语言 可 使 用 ， 
及 其 高 度 准 确 性 [37]。 经 验 显示 ，ESA 对 计算 词语 文本 的 相关 性 和 在 不 同 数 据 集 上 的 文 
本 分 类 都 有 本 质 的 改进 。 这 也 表明 ESA 确实 提高 了 传统 基于 BOW 的 检索 模型 [30] 。 

另 一 项 有 意思 的 方法 是 Wikify! 系统 提出 的 给 文本 添加 语义 [59，26]， 也 就 是 可 以 识 
别 文本 中 的 重要 概念 (关键 词 抽 取 )， 并 将 这 些 概 念 和 相应 的 Wikipedia 网 页 相连 (词义 消 
歧 )。Wikify! 系统 给 出 的 这 些 标注 可 以 自动 地 增加 与 文本 内 容 语义 相关 的 信息 。 为 了 比 
较 系 统 给 出 的 标注 和 Wikipedia 贡献 者 提供 的 人 工 标 注 的 质量 ,研究 人 员 设 计 了 一 个 类 似 - 
图 灵 测 试 的 试验 ， 要 求 参 与 者 区 分 出 人 工 和 自动 标注 。 结 果 显示 ， 计 算 机 和 人 工 给 出 的 标 
注 很 难 区 分 ， 即 说 明 Wikify! 系统 的 标注 质量 很 高 。 
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据 我 们 所 知 ， 还 没有 推荐 系统 (基于 内 容 ) 可 以 利用 前 面 提 到 的 高 级 语义 文本 表示 的 方 
法 学 习 到 用 户 现实 世界 的 真实 的 特征 。 在 几 个 任务 中 利用 如 语义 关联 、 文 本 分 类 、 检 索 等 
先进 的 文本 表示 方法 获取 到 的 正 向 结果 显示 在 推荐 任务 中 也 能 得 到 类 似 的 正 向 结果 。 这 看 
起 来 是 一 个 有 前 景 但 还 未 被 探讨 的 研究 领域 。 

在 文献 [47] 中 ， 为 了 提高 Netfilx Prize 比赛 的 推荐 准确 度 ，Wikipedia 常 被 用 来 估计 
电影 之 间 的 相似 度 。 更 具体 地 ，Wikipedia 文本 的 内 容 和 超 链接 被 用 来 衡量 电影 之 间 的 相 
似 度 。 基 于 包含 每 两 部 电影 之 间 相 似 度 的 相似 度 和 矩阵 ， 用 户 预 测 的 估计 值 使 用 K 近邻 和 伪 
SVD 算法 进行 计算 。 这 些 方法 都 是 将 Wikipedia 的 相似 度 估计 与 训练 集 的 评价 合并 ， 在 测 
试 集 上 进行 预测 人 和 估计。 遗憾 的 是 ， 这 些 技术 对 于 整体 的 精确 度 的 提高 没有 非常 重要 的 
改进 。 

文献 [88] 介 绍 了 一 个 很 复杂 但 还 没有 完成 的 过 滤 RSS 种 子 和 电子 邮件 的 方法 。 更 具 
体 地 ， 作 者 介绍 了 利用 Wikipedia 从 用 户 文档 集合 中 自动 提取 产生 用 户 特征 的 方法 。 这 个 
方法 主要 由 4 个 步骤 构 成 ， 即 Wikipedia 索引 、 特 征 产生 、 问 题 导 向 索引 数据 库 建立 和 信 
息 过 滤 。 特 征 产生 阶段 利用 隐 式 表示 用 户 感 兴趣 主题 的 历史 文档 集合 。 从 这 些 文档 中 抽取 
特征 词 ， 并 使 用 ESA 算法 得 到 它们 和 Wikipedia 相似 的 文章 。 这 时 系统 从 文章 中 抽取 出 
Wikipedia 的 分 类 列表 ， 聚 合 这 些 类 别 ， 从 而 得 到 对 应 于 用 户 个 人 信息 中 一 个 主题 的 子 类 
别 。 用 户 也 可 以 查看 自己 的 用 户 特征 ， 并 且 可 以 增加 和 修改 这 些 类 别 ， 进 而 改善 主题 特 
征 。 对 于 用 户 特 征 的 每 个 主题 ， 建 立 一 个 问题 导向 的 Wikipedia 语料库 并 索引 ， 来 表示 过 
滤 信 息 库 。 

文献 [85] 介 绍 了 一 个 在 内 容 分 析 阶 段 利用 Wikipedia 的 不 同方 法 。 更 确切 地 说 ， 该 方 
法 是 一 个 向 基于 内 容 推 荐 系统 灌输 知识 的 过 程 ， 希 望 通过 增加 文化 背景 知识 ， 相 比 于 经 典 
的 基于 词 的 方法 ， 提 高 内 容 分 析 的 准确 性 。 百 科 全 书 式 的 知识 有 利于 识别 特定 的 依赖 领域 
的 概念 或 命名 实体 ， 尤 其 是 在 那些 领域 本 体 应 用 不 可 行 的 上 下 文中 。Wikipedia 的 实体 在 
词 空 间 模型 的 基础 上 一 直 使 用 语义 向 量 进 行 建 模 [77]， 该 模型 基于 词 空间 、 向 量 空间 的 点 
表示 一 组 语义 概念 ， 如 词 和 文档 。 词 之 间 的 关系 通过 使 用 扩散 激活 算法 产生 新 特征 ， 这 些 
新 特征 可 以 用 在 推荐 过 程 中 的 多 个 方面 。 


3.3.2 学 习 用 户 特征 的 方法 


通常 用 于 推导 基于 内 容 的 用 户 个 人 信息 的 机 器 学 习 技 术 也 会 非常 适合 用 于 文本 分 类 
[82]。 在 用 来 文本 分 类 的 机 器 学 习 方 法 中 ， 推 导 过 程 通过 从 一 个 训练 文档 集合 (文档 已 经 
被 标记 为 他 们 所 属 的 分 类 ) 中 学 习 类 别 的 特征 ， 自 动 建立 一 个 文本 分 类 器 。 

学 习 用 户 特征 的 问题 可 以 转换 为 一 个 二 元 文本 分 类 任务 : 每 一 个 文档 都 根据 用 户 的 偏 
好 被 分 类 成 感 兴趣 或 不 感 兴趣 。 因 此 ， 类 别 集合 为 C= {c+ ，c- }， 其 中 ，c+ 是 正 类 (用 户 
喜欢 的 )，C- 是 负 类 (用 户 不 喜欢 的 ) 。 

下 面 将 回顾 在 基于 内 容 的 推荐 系统 中 使 用 最 多 的 学 习 算法 。 它 们 能 够 学 习 一 个 能 对 每 
个 用 户 兴趣 建 模 的 函数 。 这 些 方法 通常 要 求 用 户 赋 给 文档 一 个 相关 的 分 数 来 标记 文档 ， 自 
动 推断 出 用 户 的 个 人 信息 ， 并 用 于 过 滤 过 程 根据 用 户 的 偏好 对 文档 排序 。 
3.3.2.1 概率 方法 和 朴素 贝 叶 斯 


朴素 贝 叶 斯 是 一 个 归纳 式 学 习 的 概率 方法 ， 属 于 一 般 的 贝 叶 斯 分 类 器 。 这 类 方法 基于 
之 前 的 观察 数据 产生 一 个 概率 模型 。 该 模型 估计 文档 d 属于 类 别 。 的 后 验 概率 P Ce |a). 
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这 个 估计 是 基于 先 验 概率 P(c) ， 即 观测 到 一 个 文档 属于 类 别 c 的 概率 ，P(d|c) 即 在 给 定 
类 别 c 的 情况 下 观测 到 文档 d 的 概率 ， 和 P(d) 即 观测 到 文档 a 的 概率 。 使 用 这 些 概 率 ， 
应 用 贝 叶 斯 定理 来 计算 Pld): 


P(c)P(d|c) 
PG |d) = Pope 
为 了 对 文档 4 分 类 ， 选 择 概率 最 高 的 作为 类 别 : 

P (c;) P(d|c;) 
P(d) 
P(d) 与 所 有 类 别 c; 相等 时 ， 一 般 将 其 去 掉 。 当 我 们 不 知道 PCZdlc) 和 PCO WAN, 

我 们 利用 观测 到 的 训练 数据 对 它们 进行 估计 。 然 而 ， 这 样 估计 P(d1c) 是 有 问题 的 ， 因 为 
相同 的 文档 不 太 可 能 再 次 出 现 : 观测 数据 普遍 不 足以 产生 好 的 概率 。 朴 素 贝 叶 斯 分 类 器 通 
过 独立 假设 简化 了 该 模型 ， 从 而 克服 了 这 个 问题 ， 该 独立 假设 为 : 在 观测 文档 d 中 ， 在 给 
定 类 别 下 ， 所 有 的 词 或 记号 之 间 是 条 件 独立 的 。 文 档 中 ， 这 些 词 的 个 体 概 率 是 分 别 估 计 
的 ， 而 不 是 将 整个 文档 作为 一 个 整体 。 条 件 独立 的 假设 明显 地 违反 了 现实 世界 的 数据 ， 尽 
管 如 此 ， 朴 素 贝 叶 斯 分 类 器 在 实际 文本 分 类 经 验 上 确实 做 得 不 错 [48，11] 。 

有 两 个 被 普遍 使 用 的 朴素 贝 叶 斯 分 类 模型 : 多 元 伯 努 利 事件 模型 和 多 项 式 事件 模型 
[54]j。 两 个 模型 都 将 文档 看 作 一 个 在 语料库 词汇 表 V 上 的 向 量 值 ， 向 量 中 的 每 个 实体 表示 
它 在 这 个 文档 中 是 否 出 现 ， 因此 模型 都 损失 了 关于 词 顺 序 的 信息 。 多 元 伯 努 利 事件 模型 将 
每 个 词 编 码 为 一 个 二 元 属性 ， 即 一 个 词 出 现 或 没 出 现 ， 而 多 项 式 时 间 模 型 计算 一 个 词 在 一 
个 文档 中 出 现 的 次 数 。 经 验 结果 显示 ， 多 项 式 朴 素 贝 叶 斯 公式 的 表现 胜 过 多 元 伯 努 利 模 
型 。 尤 其 在 巨大 的 词汇 表 下 ， 这 个 效果 比较 明显 [54]。 多 项 式 事件 模型 计算 PG; |d ) 方 式 
如 下 : 


(3. 5) 


c = argmax,. 
J 


P(e; ld) = Pt? [| PG. le Na, (3. 6) 


Ni 表示 词 或 记号 n 在 文档 d; 出 现 的 次 数 。 这 里 要 注意 ， 仅 是 文档 d; 中 包含 的 词 
汇 表 子 集 Vs 的 概率 相 乘 ， 而 不 是 整个 语料库 中 词汇 表 V 中 所 有 的 词 的 概率 相 乘 。 

实现 朴素 贝 叶 斯 的 一 个 关键 步 又 是 估计 词 的 概率 P(ts1c;)。 为 了 使 概率 估计 对 于 很 少 
出 现 的 词 更 有 健壮 性 ， 需 要 采用 一 个 简单 的 事件 计数 的 平滑 方法 修正 这 个 概率 。 一 个 很 重 
要 的 平滑 作用 就 是 它 避 免 了 在 训练 数据 的 某 一 类 中 ， 一 个 没有 出 现 过 的 词 概率 为 0 的 情 
况 。 一 个 相当 简单 的 平滑 方法 是 基于 常用 拉 普 拉 斯 估计 (如 一 个 类 中 ， 所 有 的 词 计数 都 给 
它 加 1). 。Witten-BellL100j] 是 另 一 个 更 有 趣 的 方法 。 尽 管 朴素 贝 叶 斯 的 表现 不 如 其 他 的 统 
计 学 习 的 方法 ， 如 基于 近邻 的 分 类 器 或 者 支持 向 量 机 ， 但 它 在 那些 对 计算 概率 要 求 不 那么 
高 的 分 类 任务 上 表现 得 非常 好 。 朴 素 贝 叶 斯 方法 的 另 一 个 好 处 是 它 的 高 效 和 相 比 于 其 他 学 
习 方法 更 容易 实施 。 

尽管 基于 多 项 式 的 模型 分 类 器 在 词汇 表 数 量 巨大 的 情况 下 ， 优 于 基于 多 元 的 模型 ， 他 
们 的 表现 在 以 下 情况 下 也 不 令 人 满意 : 1) 训 练 集合 中 的 文档 不 一 样 长 ， 因 此 导致 参数 估计 
粗粮; 2) 处 理 稀少 的 类 (很 少 的 训练 样本 可 用 )。 这 些 情况 都 频繁 出 现在 用 户 特征 建 模 的 任 
务 中 ， 其 中 训练 文档 的 长 度 无 法 给 出 假设 ,获取 合适 大 小 的 负 例 样本 (如 类 别 c- 的 样本 ) 
是 个 问题 。 事 实 上 ， 用 户 不 会 马上 察觉 到 向 系统 提供 负 反 馈 时 效果 会 立竿见影 [81]， 训 练 
集 的 类 别 c+ 样本 (用 户 喜 欢 的 ) 可 能 经 常 都 比 类 别 c- (用 户 不 喜欢 的 ) 更 大 。 在 文献 [46] 中 ， 
作者 提出 了 一 个 多 元 泊 松 模型 的 朴素 贝 叶 斯 文本 分 类 器 ， 它 采取 比 前 面 提 到 的 条 件 概 率 更 
合理 的 参数 估计 。 我 们 已 经 将 该 方法 用 到 [36] 中 提 到 的 用 户 特征 任务 中 。 
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朴素 贝 叶 斯 分 类 器 用 在 许多 基于 内 容 的 推荐 系统 中 ， 如 Skill&.Webert[70，68]、Ne- 
wsDude[12]. Daily Learner[13]、LIBRAL65] 和 ITR[27, 83]. 
3.3.2.2 相关 反馈 和 Rocchio 算法 

相关 反馈 是 一 个 信息 检索 中 应 用 的 技术 ， 它 帮 册 用 户 逐 步 完 善 基于 之 前 搜索 结果 的 查 
询 。 它 是 由 用 户 根据 所 需 信息 检索 到 的 相关 文档 ， 给 出 的 进一步 用 户 反 馈 组 成 的 。 

相关 反馈 及 其 在 文本 分 类 中 的 融合 和 著名 的 Rocchio 公式 [75]， 都 普遍 被 基于 内 容 的 
推荐 系统 所 采用 。 基 本 的 原则 是 允许 用 户 给 推荐 系统 根据 用 户 的 信息 需求 推荐 的 文本 打 
分 。 这 种 形式 的 反馈 随后 被 用 来 逐步 改善 用 户 特 征 ， 或 者 为 训练 将 用 户 个 人 信息 作为 分 类 
器 的 学 习 算 法 所 使 用 。 

一 些 线性 分 类 器 由 类 别 的 显 式 描述 (或 原始 文档 ) 组 成 [82]。Rocchio 算法 是 一 个 可 用 
于 推导 出 这 种 线性 的 且 带 有 描述 风格 的 分 类 器 。 该 算法 将 文档 表示 成 向 量 ， 因 此 有 相似 内 ， 
容 的 文档 有 相似 的 向 量 。 向 其 的 每 个 成 分 对 应 着 文档 中 的 一 项 ， 比 较 典型 的 是 一 个 词 。 而 
每 个 成 分 的 权重 使 用 TF-IDF 计算 得 到 。 在 类 别 集合 C 中 ， 对 每 个 类 ， 通 过 合并 文档 向 量 
〈 正 例 和 负 例 样本 ) 得 到 每 个 类 的 原型 向 量 来 完成 学 习 过 程 。 对 新 文档 4 分 类 ， 计 算 文 档 d 
表示 的 向 量 与 每 个 类 的 原型 向 量 的 相似 度 ， 然 后 把 d 分 配给 与 原型 相似 度 最 高 的 类 。 

更 正式 地 ，Rocchio 算法 计算 一 个 分 类 c; BS f] EC; — (mi c opo T KW X. 
训练 集 里 不 用 词 的 集合 ) ， 公 式 如 下 : 


Qi; Ok e 
(0) ; = . e Y . = (3. 73 
; P td; 2. ! POS, ld; 24. ) NEG, 


其 中 ww 是 文档 d; 中 词 4 的 TF-IDF 权重 ，POS AI NEG, 是 指定 类 别 c, 中 的 正 例 和 
负 例 样本 集合 。8 和 7 是 控制 参数 ， 可 以 用 来 设置 所 有 正 例 和 负 例 样本 的 相关 程度 。 计 算 
文档 向 量 d, 与 每 个 类 别 的 原型 向 量 G 的 相似 度 ， 和 c; 相似 度 最 高 的 类 别 为 5， 则 将 5 作为 文 
档 必 的 类 别 。 基 于 Rocchio 的 分 类 算法 没有 任何 理论 基础 ， 也 不 保证 有 效 或 收敛 [69]。 

相关 反馈 已 经 在 许多 基于 内 容 的 推荐 系统 中 使 用 ， 如 YourNews[2]、Fab[7] 和 
NewT[87]。 
3.3.2.3 其 他 方法 

用 在 基于 内 容 的 推荐 系统 中 的 还 有 其 他 的 学 习 算法 ， 接 下 来 简要 地 介绍 一 些 非常 重要 
的 算法 。 完 整 的 概述 在 [64，69，82] 中 有 介绍 。 

在 决策 树 里 ， 所 有 内 部 节点 用 词 来 标记 ， 从 它们 出 发 的 分 支 被 标记 为 对 测试 文档 中 词 
的 权重 的 测算 ， 叶 子 节点 用 类 别 标记 。 决 策 树 的 学 习 是 通过 递归 地 分 割 训练 数据 ( 即 文本 
文档 ) 为 子 数据 集 ， 直 到 这 些 子 数据 集 仅 包含 一 个 类 别 为 止 。 数 据 分 割 是 把 文档 所 含 将 要 
标记 的 词 作为 内 部 节点 ， 在 其 上 做 权重 计算 的 测算 得 到 的 。 选 择 哪个 词 作为 分 割 的 操作 ， 
普遍 采用 的 是 信息 增益 或 信息 炳 准则 [101]。Syskill&Webert[70，68] 推 荐 系统 使 用 的 是 
决策 树 。 

决策 规则 分 类 器 和 决策 树 类 似 ， 他 们 都 采用 上 面 介绍 的 相似 的 方法 递归 地 分 割 数据 。 
规则 学 习 器 的 一 个 优点 是 ， 相 比 于 决策 树 学 习 器 ， 它 可 以 生成 一 个 更 简洁 的 分 类 器 。 规 则 
学 习 的 方法 常 试图 从 所 有 可 能 的 规则 (如 可 以 正确 将 训练 样本 全 部 正确 分 类 的 规则 ) 中 根据 
一 些 最 小 化 准则 挑选 “最 好 ”的 规则 。 

最 近邻 算法 ， 也 称 为 懒惰 学 习 器 ， 将 训练 数据 简单 地 存储 在 内 存 里 ， 对 于 一 个 新 的 样 
本 ， 通 过 一 个 相似 函数 比较 它 与 存储 的 所 有 样本 的 相似 度 ， 从 而 对 它 进行 分 类 。 确 定 “ 最 
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近邻 ?或 “k- 最 近邻 ?物品 ， 未 分 类 的 类 标签 来 源 于 最 近邻 的 类 标签 。 这 时 就 需要 相似 度 函 
数 ， 例 如 ， 当 样本 用 VSM 表示 的 时 候 ， 采 用 余弦 相似 度 。 最 近邻 算法 非常 有 效 ， 虽 然 其 
最 大 的 缺点 是 在 分 类 时 效率 低下 ， 因 为 缺少 一 个 真正 的 训练 阶段 ， 所 以 拖延 了 分 类 时 间 。 
Daily Learner[ 13 ]fll Qucikstep[L58j 使 用 最 近邻 算法 建立 一 个 用 户 短期 兴趣 模型 ， 并 将 论 
文 的 语义 标注 和 类 别名 中 的 本 体 分 别 关联 起 来 。 


3.4 趋势 和 未 来 研究 
3.4.1 推荐 过 程 中 用 户 产生 内 容 的 作用 


Web 2. 0 是 一 个 描述 万 维 网 技术 趋势 的 术语 ， 万 维 网 的 目标 是 促进 用 户 之 间 的 信息 共 
享 和 协作 。 按 照 Tim O'Reilly M, RE Web2.0 的 意思 是 以 用 户 为 中 心 ， 设 计 用 户 产 
生 内 容 的 软件 ， 因 为 其 内 容 是 由 成 千 上 万 用 户 所 贡献 的 ， 如 Flickr, Wikipedia, 
Del. icio. us, YouTube 等 网 站 。 这 也 是 Web2.0 被 称 为 “参与 性 Web” KRA. Eat, O’ 
Reilly? th X. Web2. 0“ 为 了 让 更 多 用 户 能 使 用 的 、 更 好 的 系统 设计 方法 ”。 

在 科研 领域 受到 许多 关注 的 一 种 用 户 产生 内 容 (User Generated Content, UGC) 的 方 
法 是 大 众 分 类 法 ， 这 是 一 种 由 用 户 产 生 的 分 类 学 ， 用 户 大 量 地 选择 被 称 为 标签 的 关键 字 来 
协助 标注 和 分 类 感 兴趣 的 资源 。 

尽管 在 推荐 系统 领域 里 已 经 有 相当 数量 的 重要 研究 ， 但 是 相 比 推荐 标签 问题 ，( 如 辅 
助 用 户 进行 标注 )[L98，95]， 人 们 对 将 标签 整合 到 标准 推荐 系统 算法 ,特别 是 基于 内 容 的 
算法 ， 所 面临 的 特定 问题 的 探索 还 少 很 多 。 : 

大 众 分 类 法 在 推荐 系统 领域 提供 了 新 的 机 会 和 挑战 (参考 第 19 章 ) 。 我 们 应 该 研究 这 
些 标 签 是 否 能 够 代表 用 户 兴趣 的 有 价值 信息 ， 是 否 应 该 被 包含 在 用 户 信息 中 。 当 前 已 经 发 
现 了 设计 标签 系统 的 几 个 难点 ， 如 多 义 词 、 标 签 同 义 词 ， 或 者 是 不 同 领域 的 标注 者 同时 标 
注 ， 会 使 得 标签 在 描述 资源 对 象 的 时 候 处 于 多 个 抽象 层次 ， 或 者 造成 混乱 的 标签 扩散 现象 
[40]. 
3.4.1.1 推荐 系统 的 社会 化 标签 

现 有 研究 中 已 经 在 基于 内 容 的 推荐 系统 中 引入 了 几 种 用 户 打 标 签 的 方法 。 

在 文献 [28] 中 ， 用 户 个 人 信息 以 标签 向 量 的 形式 展现 ， 每 一 个 元 素 表 示 一 种 标签 被 用 
户 赋值 给 文档 的 次 数值 。 文 献 [57] 中 提出 了 一 个 更 加 复杂 的 方法 ， 考 虑 了 标签 的 共 现 。 用 
户 个 人 信息 和 信息 源 的 匹配 是 通过 使 用 简单 字符 串 匹 配 来 实现 的 。 正 如 作者 本 身 所 预见 到 
的 ， 采 用 WORDNET 可 以 改进 匹配 效果 。 

在 由 Szomszor 等 [96] 给 出 的 文章 中 ， 作 者 描述 了 一 种 电影 推荐 系统 ， 纯 粹 建立 在 采 
用 协同 标注 方法 赋 给 电影 的 关键 字 上 。 对 于 活路 用户， 推荐 系统 的 算法 是 基于 电影 相似 性 
来 计算 的 ， 即 计算 其 他 电影 和 用 户 评价 过 的 电影 之 间 的 标签 相似 性 。 正 如 作者 所 述 ， 推 荐 
算法 能 通过 综合 基于 标签 属性 和 更 多 传统 基于 内 容 的 推荐 策略 中 的 技术 来 提高 推荐 效果 。 

文献 [33] 提 出 几 种 不 同 的 策略 来 建立 基于 标签 的 用 户 个 人 信息 ， 并 利用 它们 来 构造 音 
乐 推荐 系统 。 基 于 标签 的 用 户 个 人 信息 是 由 标签 集合 来 定义 的 ， 这 些 标签 被 用 户 用 来 标注 
唱片 ， 同 时 标签 也 带 有 相应 的 分 数 用 以 代表 用 户 在 这 些 标签 上 的 兴趣 程度 ， 如 根据 标签 的 
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使 用 频率 和 听 音 乐 的 频率 来 标注 。 

以 上 描述 的 方法 中 只 有 一 组 单一 的 热门 标签 来 描述 用 户 的 兴趣 ， 文 献 L102] 提 到 这 可 
能 并 不 是 最 合适 的 描述 用 户 的 方法 ， 因 为 它 不 能 反映 用 户 的 多 种 兴趣 。 因 此 ， 作 者 提出 一 
种 网 络 分 析 技 术 ( 基 于 聚 类 方法 ) ， 基 于 用 户 个 性 化 标签 来 识别 他 们 不 同 的 兴趣 。 

关于 标签 解析 的 方法 ，Cantador 等 在 文献 [19] 提 出 了 一 个 模型 来 选择 有 意义 的 标签 ， 
利用 WORDNET、 维 基 以 及 谷歌 等 渠道 获取 一 组 初始 未 加 工 的 标签 ， 并 从 中 选择 合适 的 
标签 。 如 果 标 签 在 WORDNET 中 被 直接 匹配 ， 那 么 直接 使 用 ; 否则 ， 可 能 的 拼写 错误 以 
及 复合 名 词 通过 使 用 谷歌 的 “你 是 X XX 意思 吗 ” 机 制 来 发 现 匹 配对 象 ( 例 如 ， 标 签 san- 
francisco 或 者 san farncisco 被 纠正 成 san francisco) 。 最 后 ， 标 签 被 关联 到 他 们 相应 的 维基 
条 目 上 。 

在 Gemmis 等 的 文章 [36] 中 提出 了 一 种 更 复杂 的 算法 ， 算 法 实现 了 一 种 混合 策略 ， 从 
(静态 ) 内 容 以 及 被 用 户 评分 的 相关 物品 中 学 习 用 户 个 人 信息 。 作 者 将 用 户 个 人 信息 ， 以 及 
他 自己 的 个 性 化 标签 包含 进来 ， 同 时 还 采纳 被 其 他 用 户 评价 过 的 物品 的 标签 (社会 标签 ) 。 
当 对 大 众 化 分 类 有 贡献 的 用 户 具 有 不 同 的 专业 领域 知识 时 ， 这 方面 显得 特别 重要 。 在 用 户 
个 性 化 属性 中 引入 社会 标签 的 内 容 使 得 纯 基 于 内 容 推荐 的 理论 被 扩展 到 混合 协同 内 容 理论 
L17]。 此 外 ， 从 标签 中 识别 用 户 兴趣 的 解决 方法 也 被 提出 来 。 由 于 用 户 自由 选择 标签 以 及 
他 们 实际 行为 不 是 很 清楚 的 事实 ， 作 者 建议 通过 基于 WORDNET 的 词义 消 歧 算法 来 解释 
标签 。 一 个 类 似 的 混合 方法 也 在 文献 [38] 中 被 提出 来 ， 其 方法 结合 了 基于 标签 标注 行为 所 
表达 的 兴趣 内 容 以 及 基于 内 容 的 用 户 个 人 信息 。 

文献 [20] 也 提出 了 一 些 关于 如 何 通 过 WORDNET 方法 来 分 析 标 签 以 便于 获得 用 户 意 
图 的 想法 ， 但 是 实验 结果 并 不 支持 文中 提出 的 思路 。 文 献 [104] 提 出 通过 WORDNET 的 方 
法 来 语义 解释 标签 的 另 一 种 方法 。 作 者 设计 了 一 个 让 邻居 进行 选择 的 算法 ， 证 明了 在 协同 
过 滤 算 法 中 标签 的 有 效 性 。 邻 居 选 择 是 指 在 WORDNET 中 计算 不 同 用 户 之 间 的 标签 语义 
距离 。 

我 们 相信 ， 依 靠 不 同 知识 源 的 方法 (如 WORDNET 或 维基 ) 来 识别 标签 含义 的 挑战 性 
研究 是 有 用 的 。 此 外 ， 通 过 考虑 个 性 化 ， 社 会 化 以 及 专家 的 标签 的 不 同 特性 ， 可 以 设计 出 
新 的 策略 ， 在 学 习 基 于 内 容 的 用 户 个 人 信息 过 程 中 整合 标签 。 事 实 上 ， 个 性 化 标签 大 部 分 
是 主观 的 ， 而 且 前 后 不 一 致 ， 相 反 ， 专 家 的 标签 是 客观 和 一 致 的 。 社 会 化 标签 则 趋向 某 种 
形式 的 连贯 性 [5]。 

男 一 种 有 意义 的 研究 方向 是 以 分 析 标 签 来 获得 有 力 的 反馈 来 推断 用 户 个 人 信息 。 表 达 
用 户 观 点 和 情绪 的 标签 能 表达 用 户 对 物品 的 满意 度 ， 如 厌烦 、 感 兴趣 、 好 、 坏 等 。 情 感 计 
算 研究 领域 的 技术 的 确 有 必要 。 


3.4.2 超越 特 化 : THEE 


正如 在 3. 2. 2 节 中 介绍 的 ， 基 于 内 容 的 推荐 系统 被 诉 病 过 于 特 化， 因为 只 推荐 被 用 户 
评价 过 的 相似 物品 。 解 决 这 一 问题 的 可 能 方案 是 引入 一 些 随机 性 。 例 如 ， 信 息 过 滤 领 域 
[87] 曾 提出 过 采用 遗传 算法 。 另 外 ， 特 化 问题 不 仅 是 避免 推荐 和 用 户 以 前 用 过 的 一 样 的 物 
品 。 在 一 定 情 况 下 ， 如 果 物 品 和 用 户 以 前 用 过 的 物品 太 相 似 也 不 应 该 被 推荐 ， 例 如 ， 描 述 
同一 个 事件 的 不 同文 章 。 因 此 ， 如 果 物 品 和 用 户 以 前 用 过 的 物品 特别 相似 ， 一 些 基于 内 容 
的 推荐 系统 会 过 滤 掉 这 些 物 品 ， 如 Daily-Learner[13]。Zhang 等 [103] 提 出 的 元 余 度量 被 
用 来 衡量 相关 的 文档 是 否 包含 新 颖 的 信息 。 总 之 ， 推 荐 的 多 样 性 是 推荐 系统 中 通常 的 理想 
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在 推荐 系统 中 惊喜 度 可 以 被 看 作 接 收 到 未 预料 和 意外 的 物品 推荐 的 体验 ， 因 此 是 一 种 
多 样 性 推荐 的 方式 。 根 据 Gup 的 理论 L41]， 当 用 户 依 赖 探索 和 运气 来 寻找 他 们 不 知道 并 
且 期 望 的 物品 时 ， 基 于 内 容 的 系统 由 于 特 化 问题 ， 在 产生 意外 发 现 方面 存在 软肋 。 

明确 区 分 新 颖 性 和 惊喜 度 之 间 的 区 别 是 有 用 处 的 。 根 据 Herlocker[42] 的 解释 ， 新 颖 
性 是 指 系统 建议 给 用 户 一 个 他 已 经 能 独立 发 现 的 未 知 物品 。 意 外 发 现 是 指 推荐 系统 帮助 用 
户 找到 使 用 其 他 方法 无 法 发 现 的 一 个 令 人 惊讶 的 有 趣 物品 (或 者 是 很 难 真 正 被 发 现 )。 为 了 
提供 清晰 的 区 分 新 颖 性 和 惊喜 度 之 间 的 区 别 的 例子 ， 请 设想 推荐 系统 只 推荐 用 户 喜 欢 的 导 
演 执 导 的 电影 。 如 果 系 统 推荐 一 部 用 户 未 意识 到 的 电影 ， 其 可 能 是 新 颖 的 ， 但 是 可 能 不 是 
惊喜 度 。 另 一 方面 ， 推 荐 一 部 由 一 个 新 导演 执导 的 电影 可 能 更 会 提供 一 个 意外 惊喜 。 惊 喜 
度 的 推荐 按照 定义 也 是 新 颖 的 。 

惊喜 度 问 题 的 挑战 在 于 要 去 设计 惊喜 ， 也 就 是 说 要 找到 一 种 方式 ， 能 够 在 推荐 过 程 中 
以 一 种 可 操作 的 方式 推导 出 惊喜 之 处 。 从 该 角度 而 言 ， 问 题 还 没有 得 到 深入 的 研究 ， 并 且 
理论 和 实验 研究 也 都 相当 少 。 

如 Toms 解释 的 那样 L[97]， 搜 索 信 息 有 三 种 类 型 : 

。 寻找 已 定义 好 对 象 的 信息 ; 

。 寻找 不 能 完全 描述 对 象 的 信息 ， 但 是 第 一 眼 能 被 识别 的 ; 

。 以 一 种 碰巧 、 偶 然 或 意外 的 方式 获取 信息 。 - 

不 难看 出 ， 意 外 发 现 对 于 前 两 种 获取 方式 没有 用 处 ， 但 是 对 于 第 三 种 方法 特别 重要 。 
我 们 讨论 关注 于 在 基于 内 容 推 荐 中 发 现 意外 惊喜 策略 的 实现 ， 对 应 到 实际 世界 中 的 恰当 比 
喻 是 ， 一 个 人 去 购物 或 者 参观 博物 馆 ， 当 他 漫 无 目的 行走 时 ， 可 能 发 现 他 从 来 没有 期 望 发 
现 过 的 全 新 东西 ， 这 个 对 他 而 言 肯定 有 趣 。 在 关于 “可 操作 地 推导 出 意外 惊喜 ”方面 已 经 提 
出 不 同 的 方法 中 ，Toms 建议 了 四 种 策略 ， 从 最 简单 的 到 比较 复杂 的 列举 如 下 [97]: 

。 碰 运 气 或 者 撞 大 运 ， 通 过 随机 信息 节点 产生 来 实现 ; 

。 Pasteur 法 则 (机 会 垂青 有 准备 的 人 )， 通 过 用 户 个 人 信息 来 实现 ; 

。 不 寻常 情况 和 例外 情况 ， 通 过 弱 相 似 度量 来 部 分 实现 ; 

。 类 比 推理 ， 这 些 实现 目前 未 知 。 

文献 [44] ， 描 述 了 一 个 实现 “不 寻常 情况 现象 和 异常 例外 ”方法 的 提议 ， 为 了 在 传统 的 
推荐 中 提供 意外 发 现 的 推荐 ， 因 此 在 系统 中 提供 用 户 新 的 指向 物品 的 和 人口 。 最 基本 的 假设 
是 用 户 知道 物品 的 概率 越 低 ， 特 定 物 品 导致 意外 惊喜 的 概率 越 高 。 用 户 知道 那些 在 语义 上 
与 系统 确信 用 户 所 知 物品 相近 的 概率 ， 要 高 于 那些 语义 较 远 的 物品 的 概率 。 换 句 话 说 ,更 
加 类 似 于 通过 提供 与 用 户 个 人 信息 不 相似 的 东西 来 获得 意外 发 现 。 根 据 该 原则 ， 在 文献 
[44] 中 提出 的 最 基本 想法 是 依据 用 户 个 人 信息 和 物品 描述 之 间 的 相似 度 来 搜寻 意外 发 现 物 
品 。 系 统 依据 朴素 贝 叶 斯 分 类 器 来 实现 ， 它 能 够 把 物品 分 成 感 兴趣 的 (C+ 类 ) 和 不 感 兴趣 
的 (C- 类 )， 计算 取决 于 由 分 类 器 计算 好 的 先 验 概率 。 为 了 整合 Tom 的 “ 低 相 似 度 ”到 推荐 
系统 中 ， 物 品 和 用 户 个 人 信息 的 匹配 会 生成 根据 C+ 类 别 中 的 先 验 概率 产生 的 物品 排列 列 
表 。 列 表 的 顶端 是 和 用 户 个 人 信息 最 相似 的 物品 ， 例 如 ， 被 定 为 C+ 类 的 最 高 评分 物品 。 
另 一 方面 ， 被 分 类 为 C- 类 的 先 验 概 率 较 高 的 物品 在 列表 的 底 端 。 系 统 中 不 确定 的 物品 是 
在 两 个 分 类 分 数 之 间 趋 于 零 的 那些 物品 。 因 此 假设 这 些 物 品 不 为 用 户 所 知 是 有 意义 的 ， 因 
为 系统 不 能 够 清晰 地 划分 它们 是 否 相 关 。 那 些 在 C+ 和 C- 之 间 区 别 很 小 的 物品 很 难 被 分 
类 ， 所 以 对 于 用 户 来 说 属于 意外 的 发 现 。 
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在 评估 惊喜 度 问 题 的 时 候 ， 很 难 获取 惊喜 的 情感 反应 水 平 ， 因 此 有 效 的 惊喜 度 衡量 方 
法 应 该 脱离 传统 的 精确 度 度 量 方法 以 及 相关 的 实验 方法 。 文 献 [55] 中 列 出 了 以 用 户 为 中 心 
的 评估 推荐 系统 的 新 的 指导 性 方向 ， 如 推荐 系统 的 惊喜 度 。 这 些 度量 组 成 了 有 趣 而 且 重 要 
的 研究 课题 (参考 第 8 H). 

总 之 ， 在 扩充 基于 内 容 的 推荐 系统 的 时 候 ， 采 用 具有 惊喜 度 的 策略 ， 如 提供 令 用 户 吃 
惊 的 推荐 结果 ， 可 以 有 效 降低 系统 的 特 化 问题 。 


3.5 总 结 


本 章 总 结 了 基于 内 容 的 推荐 系统 领域 的 相关 研究 ， 并 且 概 述 了 系统 所 需要 的 各 个 重要 
特性 与 方法 。 尽 管 在 不 同 的 领域 有 许多 的 推荐 系统 ， 但 是 都 用 共同 的 方法 来 表示 被 推荐 的 
物品 和 用 户 个 人 信息 。 本 章 首先 讨论 的 主要 论点 涉及 物品 的 表述 ， 从 最 简单 的 结构 化 数据 
描述 ， 到 信息 检索 研究 领域 中 比较 复杂 的 非 结 构 化 数据 。 我 们 分 析 了 过 去 15 年 推荐 系统 
的 主要 内 容 ， 并 强调 一 种 更 加 复杂 “语义 分 析 ” 是 必要 的 ， 这 个 方法 的 复杂 性 远 超 通 过 关键 
字 来 描述 用 户 兴 趣 。 概 述 了 在 推荐 过 程 中 采用 的 一 些 主要 的 语义 策略 ， 并 提供 了 语言 学 知 
识 主 导 性 作用 的 证 据 ， 在 不 同 的 应 用 领域 中 基于 不 同 语 境 的 用 户 兴趣 分 析 需 要 更 加 深入 且 
专业 的 知识 。 最 新 的 研究 中 也 强调 了 运用 世界 范围 的 知识 的 重要 性 ， 如 Wikipedia， 尽 管 
它们 在 学 习 用 户 个 人 信息 的 文本 中 还 没有 被 使 用 。 在 总 结 中 也 提出 了 多 种 学 习 算 法 。 

本 章 的 最 后 一 部 分 致力 于 讨论 下 一 代 基 于 内 容 推 荐 系统 的 主要 趋势 以 及 研究 。 特 别 是 ， 
本 章 提出 了 有 关 Web 2. 0 发 展 和 变革 的 一 些 内 容 ， 将 改变 个 性 化 的 玩法 ， 因 为 用 户 的 角色 从 
被 动 消费 信息 进化 到 主动 贡献 信息 。 最 近 的 一 些 研究 工作 以 及 将 来 的 研究 方向 中 包含 了 一 些 
有 争论 的 策略 ， 例 如 ， 把 整合 用 户 自 定义 词汇 作为 一 种 扩展 词典 的 方式 ， 如 大 众 分 类 法 。 

最 后 ， 文 中 提出 了 内 容 推 荐 系统 中 非常 特别 的 一 个 方面 。 由 于 这 种 系统 本 身 的 性 质 ， 
他 们 只 能 推荐 与 用 户 个 人 信息 匹配 度 很 高 的 物品 ， 因 此 用 户 被 限制 在 那些 与 用 户 曾 经 评价 
过 的 物品 相似 的 物品 集合 中 。 这 种 被 称 为 特 化 的 缺点 阻碍 了 系统 在 真实 世界 场景 中 推广 使 
用 。 文 中 分 析 了 一 些 为 用 户 提供 惊讶 和 非 预 期 (意外 发 现 ) 结 果 的 可 能 方法 。 

最 后 ， 我 们 想 强调 高 级 物品 表示 方法 中 语言 处 理 研究 的 重要 性 。 以 下 引用 一 个 例子 ， 
我 们 从 美国 专利 局 和 版 权 署 中 获取 谷歌 公司 的 专利 消息 是 非常 有 价值 的 。 例 如 ， 这 些 专利 
之 一 ， 名 字 叫 开放 用 户 信 息 描述 方法 ， 像 如 下 方法 描述 用 户 信息 :“ 我 真 的 喜欢 远足 ， 特 
别 是 能 在 外 野营 几 天 的 长 途 远足 。 室 内 活动 我 一 点 都 提 不 起 兴趣 ， 我 真 的 厌烦 类 似 于 园艺 
的 室内 活动 .使 用 智能 的 语言 处 理 算法 来 发 现 用 户 的 情绪 (对 短途 旅行 和 园艺 是 喜欢 或 者 
不 喜欢 ) 和 其 他 语言 线索 ， 系 统 可 能 会 提供 户外 活动 相关 的 广告 给 该 用 户 ， 但 是 尽量 避免 
提供 其 他 业余 爱好 方向 的 广告 [3]。 

我 们 希望 本 章 所 提出 的 论点 能 够 对 科研 领域 的 下 一 代 基 于 内 容 推 荐 技术 起 到 促进 作用 。 
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Christian Desrosiers 和 George Karypis 


摘要 ”基于 近邻 (nearest-neighbor) 算 法 广泛 用 于 协同 推荐 方法 中 ， 原 因 在 于 该 算法 简 
单 、 有 效 ， 且 能 够 提供 准确 及 个 性 化 的 推荐 。 本 章 将 详细 综述 应 用 于 物品 推荐 问题 的 基于 
近邻 算法 ， 特 别 是 该 类 算法 的 优势 和 重要 特性 。 同 时 本 章 列 出 实现 这 样 一 个 系统 时 需要 做 
出 的 基本 决策 ， 并 给 出 一 些 实用 经 验 。 本 章 最 后 将 讨论 在 大 型 商业 推荐 系统 中 的 稀 朴 性 
(sparsity) 和 受 限 覆盖 (limited coverage) 的 问题 ， 并 描述 相应 的 解决 方法 。 


4.1 简介 


在 线 购物 商城 的 出 现 和 发 展 给 客户 购物 方式 产生 重要 影响 ， 这 种 购物 方式 能 让 客户 接 
触 到 大 量 的 商品 和 相关 的 商品 信息 。 随 着 这 种 自由 购物 方式 的 出 现 ， 使 得 在 线 商城 模式 成 
为 亿 元 行业 ( 即 巨大 收益 行业 ) ， 同 时 也 使 得 客户 越 来 越 难 选择 到 适合 自己 的 商品 。 推 荐 系 
统 是 对 这 种 信息 过 载 问题 一 种 重要 的 解决 方法 ， 可 以 自动 提供 给 客户 个 性 化 的 商品 建议 。 
推荐 系统 已 经 广泛 应 用 于 众多 领域 中 ， 例 如 ， 书 籍 、CDL47，53]、 音 乐 L45，70]j、 电 影 
[31，51，5]、 新 闻 L6，41，76]、 幽 默 笑 话 L23] 和 网 页 L[7，52] 。 

推荐 问题 可 以 定义 为 评估 用 户 对 新 物品 的 反馈 ， 这 种 评估 是 基于 该 系统 中 历史 数据 信 
息 ， 同 时 推荐 那些 预测 反馈 兴趣 高 的 新 颖 (novel) 和 独到 (original) 的 物品 给 客户 。 这 种 基 
于 物品 的 反馈 类 型 在 各 个 系统 中 的 表现 可 能 不 大 一 样 ， 但 大 致 可 以 分 为 三 种 : 分 级 反馈 
(scalar response) 、 二 元 反馈 (binary response) 和 一 元 反馈 (unary response) 。 分 级 反馈 也 
就 是 人 们 熟悉 的 评分 制 ， 例 如 ， 用 数值 (1 到 5 星 ) 或 比较 标准 (强烈 同意 ， 同 意 ， 一 般 ， 反 
对 ， 强 烈 反 对 ) 来 表示 这 些 客户 对 物品 的 反馈 程度 。 二 元 反馈 仅 有 两 种 对 立 的 值 来 表示 评 
估 情 况 ( 例 如 ， 喜 欢 / 厌 恶 ; 感 兴趣 /不 感 兴趣 ) 。 最 后 ， 一 元 反馈 是 获取 客户 与 物品 互动 行 
为 信息 (如 购买 、 在 线 访问 等 ) 而 没有 具体 关于 用 户 对 于 物品 的 评价 。 因 为 大 多 数 用 户 一 般 
倾向 于 浏览 感 兴趣 的 物品 ， 一 元 反馈 依然 能 够 提供 关于 客户 喜好 的 有 用 信息 。 

获取 用 户 的 反馈 信息 方式 也 是 多 种 多 样 的 ， 例 如 ， 对 于 一 个 电影 推荐 应 用 来 说 ， 用 户 
可 以 在 观看 完 电影 后 给 出 自己 具体 的 评分 ， 给 出 相应 的 观点 。 用 户 反 馈 也 可 以 从 具体 购买 
历史 或 者 访问 模式 中 获得 [41，76]， 例 如 ， 当 用 户 花 了 大 量 时 间 浏 览 具体 物品 类 型 的 时 
候 ， 可 以 认为 这 是 用 户 感 兴趣 的 物品 类 型 。 为 了 简洁 ， 后 面 用 评分 来 代替 各 种 类 型 的 用 户 
反馈 。 
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4.1.1 问题 公式 化 定义 


为 了 给 物品 的 推荐 任务 进行 公式 化 定义 ， 我 们 需要 介绍 一 些 基本 概念 。 在 系统 中 我 们 
定义 用 户 集合 为 4， 物 品 集合 T。 因 此， 我 们 定义 了 为 系统 评分 集合 ，s 为 用 于 评分 可 选 的 
分 数 集合 (如 s 二 [1，5] 或 者 s==[ 喜 欢 ， 不 喜欢 ])。 同 时 ， 我 们 将 ri 表示 为 用 户 u€ wu 对 于 
特定 物品 tC I 的 评分 ， 同 时 假定 ri 的 取 值 个 数 不 能 多 于 一 个 (rs 要 么 有 一 个 取 值 要 么 没有 
BE). RAHU: 表示 集合 中 已 经 对 物品 i 进行 了 评分 的 用 户 集合 。 同 样 ，Z 表示 被 用 户 
U 所 评分 物品 集合 。 同 时 被 用 户 ufo 所 评分 的 物品 集合 (Z. 门 Z.) 可 以 表示 成 Ze 。zw 则 用 
于 表示 同时 对 物品 i 和 物品 7 都 进行 了 评分 的 用 户 集合 。 

最 优 项 (best item) 和 最 优 N 项 (top-N) 是 推荐 系统 中 最 重要 两 个 问题 。 最 优 项 是 指 用 
户 u 最 有 可 能 感 兴趣 的 新 物品 项 i€E 工 \ 工 ,。 当 评分 值 存在 时 ， 这 个 最 优 项 通常 可 以 定义 为 
一 个 回归 或 者 (多 类 ) 分 类 问题 ， 其 目标 是 用 学 习 函 数 f:u XI 一 s 来 预测 用 户 x 对 于 物品 i 
的 评分 f(u，i) 。 这 样 就 可 以 通过 这 个 函数 并 利用 下 面 的 式 子 预测 评价 用 户 U 对 于 哪 一 样 
物品 i" 具有 最 高 分 数 项 (也 就 是 最 优 项 ) : 

i = argmaxf (ua TP) (4.1) 

准确 性 是 通常 用 来 评测 推荐 系统 效果 的 主要 方法 。 一 般 来 说 ， 评 分 集合 尺 可 以 分 为 用 


于 训练 函数 f 的 训练 集 RRwsis 和 用 来 测试 预测 效果 的 测试 集 R.。: 两 种 常用 的 测试 预测 准确 
性 的 标准 分 别 为 平均 绝对 误差 (MAE): 






MAECO SS F | f(t) — ra | (4. 2) 
| Rrest | em 
和 均 方 根 误差 (RMAE): 
RMSE(f) = | 3 (fui) — re)? (4. 3) 


| Rees | 人 Ra 

当 没 有 可 用 评分 信息 的 时 候 ， 例 如 ， 仅 拥有 用 户 购 买 商品 的 列表 ， 评 估 预 测 分 数 的 准 
确 性 是 不 可 能 的 。 在 这 种 情况 下 ， 对 于 寻找 最 优 项 问题 通常 就 转换 为 向 用 户 推荐 感 兴趣 的 
列表 : 列表 L(w) 包 含 用 户 u 最 感 兴趣 的 N 项 物品 L18，45]。 评 估 这 种 方法 的 质量 也 是 
将 物品 列表 分 为 用 于 训练 函数 工 的 训练 集合 Twwin 和 用 于 测试 的 测试 集合 Test。 令 TGOC 
工 门 Ter 表示 测试 物品 中 用 户 w 认为 相关 的 物品 子 集 如 果 用 户 的 反馈 是 二 元 反馈 (binary 
responses)， 那 么 这 些 物 品 项 就 是 指 用 户 u 所 给 评分 为 正 的 。 如 果 列 表 中 仅 给 出 来 用 户 购 
买 或 者 浏览 了 物品 项 ， 那 么 这 些 物 品 项 就 可 以 直接 用 于 表示 T(u)。 这 类 方法 的 效果 可 通 
过 准确 率 (precision) 和 召回 率 (recall) 进 行 评估 : 


Precision(L) = nA LG) N TG) |/1LGO0 | (4. 4) 
u€u 
1 
Recall(L) = T 2 |L) N TG2|/1L G2 | (4. 5) 
u€u 


这 种 方法 的 缺点 就 是 L(w) 中 所 有 的 物品 对 于 用 户 x 的 感 兴趣 程度 (权重 ) 都 是 认为 等 同 的 。 

文献 [18j 提 供 了 一 种 解决 方法 ,构造 函数 工 可 以 使 得 用 户 w 所 对 应 的 列表 L (wu) 所 包 
含 的 物品 是 根据 用 户 感 兴趣 程度 排列 好 的 。 如 果 测 试 集 是 随机 划分 的 ， 对 每 个 用 户 x， 其 
对 应 物品 集合 ZT。 中 一 个 项 可 以 表示 为 i,。 那 么 评估 函数 工 的 效果 可 以 通过 平均 逆 命 中 率 
(Average Reciprocal Hit-Rank，ARHR) 衡 量 . | 
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LS 
EXC D (4. 6) 
ARHR(.) = TT 25 ranka wo) 


其 中 rankG,L G0) RA i, 4EL GO P dle s IR ELC, BAI Coo. LT EX 
于 评估 推荐 系统 效果 标准 的 内 容 可 以 阅读 本 书 第 8 n6. 


4.1.2 推荐 方法 概要 


推荐 问题 真正 作为 独立 研究 领域 是 在 20 世纪 90 年 代 中 期 ， 推 荐 系统 与 其 他 领域 ， 如 
认 知 科学 (cognitive science)[42] 和 信息 检索 (information retrieval)L65]， 有 深厚 渊源 。 解 
决 推荐 问题 方法 通常 分 为 两 个 大 类 ， 基于 内 容 方法 (content-based) 和 协同 过 滤 方 法 (col- 
laborative filtering) 。 
4.1.2.1 基于 内 容 方法 

基于 内 容 方 法 [7，8，44，58]( 基 于 认 知 ) 的 大 致 规则 是 ， 通 过 用 户 已 经 评分 的 物品 来 
确定 这 些 物品 的 共同 特点 ， 并 利用 这 些 特点 为 用 户 4 推荐 也 有 这 些 特点 的 新 物品 。 基 于 内 
容 推 荐 系统 ， 可 以 通过 向 量 ” 形式 来 描述 物品 的 大 基 信 息 。 当 物 贞 载 体 是 文本 内 容 时 ， 
如 新 闻 [8，44]、Web 文档 [7，58]， 这 些 向 量 就 包含 了 内 容 有 效 关 键 字 的 " 词 频 - 逆 文档 频 
率 ”(Term Frequency-Inverse Document Frequency, TF-IDF) A (65), MFI u, X} 
应 的 偏好 属性 x, 通常 可 以 通过 物品 集合 五 的 内 容 获 得 。Rocchio 算法 [78，12] 是 计算 这 
些 偏好 的 技术 ， 用 于 多 个 基于 内 容 的 推荐 系统 ， 如 Newsweeder[ 44] 和 Fab[7]。 只 要 用户 
u 对 物品 i 评分， 该 技术 就 会 更 新 用 户 的 偏好 向 量 X,， 方 法 是 在 X, "RU X, 的 权重 和 
用 户 uo pth i PEAY HY Fe A 

x= Druk 


3x REI ET LA AI E E f V UA o HAEE T8] M x; 与 偏好 向 最 x, 相似 度 最 接近 的 物品 作 
为 新 物品 推荐 给 用 户 x。 例 如 ， 利 用 余弦 相似 度 L7，8，44] 或 者 最 小 描述 长 度 (Minimum 
Description Length，MDL)[44，62] 方 法 。 这 种 方法 也 可 以 被 用 来 预测 用 户 对 新 物品 的 评 
分 [44]， 通 过 为 每 个 评价 值 rE s 构 建 对 应 内 容 属性 向 量 xz 作为 用 户 & 评价 过 的 物品 特征 
向 量 的 平均 值 。 物 品 i 的 预测 评分 后 是 与 x 最 相似 的 xs” 的 评分 值 >。 使 用 内 容 信息 的 贝 
叶 斯 算法 也 提出 了 预测 评价 的 算法 [8，53，58]。 

推荐 系统 单纯 依赖 内 容 信息 通常 会 受到 受 限 内 容 分 析 (limited content analysis) 和 特 化 
(over-specialization) 问 题 困扰 [70]。 受 限 内 容 分 析 主 要 是 系统 中 仅 有 有 限 的 用 户 信 息 或 者 
物品 信息 。 有 许多 原因 造成 这 种 信息 的 昨 乏 ， 例 如 ， 一 些 隐私 问题 影响 用 户 提 供 个 人 信 
息 ， 或 者 难以 准确 地 描述 物品 的 内 容 ， 抑 或 者 获取 某 些 项 目 类 型 需要 代价 晶 贵 ， 如 音乐 、 
图 片 。 而 且 ， 物 品 内 容 也 通常 难以 有 效 决定 其 质量 ， 例 如 ， 在 一 篇 好 文章 和 差 文 章 之 间 ， 
如 果 它 们 都 使 用 了 相同 的 短语 ， 那 么 (文章 质量 ) 就 不 可 能 区 分 开 。 

男 一 方面 ， 特 化 是 基于 内 容 推 荐 系统 中 推荐 新 物品 时 的 一 个 负 影 响 问题 ， 其 中 如 果 一 
个 新 物品 与 用 户 喜 欢 已 有 物品 相似 ， 那 么 预测 用 户 对 该 物品 的 评分 则 高 。 例 如 ， 系 统 给 用 
户 推荐 的 电影 ， 其 风格 或 者 是 演员 与 该 用 户 已 经 看 过 的 电影 一 样 。 解 决 这 类 问题 方法 包括 
加 入 随机 性 [71] 或 者 过 滤 掉 一 些 过 于 相似 的 物品 [8，77]。 更 多 关于 内 容 推荐 方法 可 以 查 
看 本 书 的 第 3 M, 
4.1.2.2 协同 过 小 方法 


基于 内 容 方 法 是 使 用 被 用 户 评分 过 的 物品 内 容 ， 而 协同 (社会 ) 过 小 方法 还 取决 于 在 系 
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统 中 被 其 他 用 户 评分 过 的 物品 内 容 [18，31，41，47，60，45，70]。 其 关键 点 在 于 ， 如 果 
AP u 和 用 户 wv 在 其 他 物品 评分 上 很 相似 ， 那 么 用 户 u 对 新 物品 i 的 评分 和 另 一 用 户 v 对 
新 物品 i 的 评分 也 是 相似 的 。 同 样 ， 如 果 其 他 用 户 对 物品 i 和 物品 ;7 给 了 相似 的 评分 ， 那 
ZAP u 也 会 给 予 这 两 个 物品 相似 的 评分 。 

协同 过 滤 方 法 可 以 克服 基于 内 容 方法 的 一 些 局 限 。 例 如 ， 当 物品 的 内 容 不 完全 或 者 难 
以 获得 的 时 候 ， 依 然 可 以 通过 其 他 用 户 的 反馈 来 推荐 给 用 户 。 同 时 ， 协 同 过 滤 推 荐 是 基于 
用 户 之 间 对 物品 的 评价 质量 ， 而 不 是 仅仅 依赖 可 能 会 干扰 质量 判断 的 内 容 。 另 外 ， 与 基于 
内 容 方法 不 同 的 是 ， 只 要 其 他 用 户 已 经 显示 对 这 些 不 同 物品 的 兴趣 ， 那 么 协同 过 滤 推 荐 方 
法 可 以 推荐 内 容 差 异 很 大 的 物品 。 

从 文献 [1，5，10，18j] 中 可 以 看 到 ， 协 同 过 滤 方 法 可 以 大 致 分 为 两 类 : 基于 近邻 方法 
和 基于 模型 方法 。 在 基于 内 存 L10j 或 基于 启发 式 [1]) 协 同 过 滤 方 法 中 [17, 18, 31, 41, 
47, 54, 60, 45, 70], 系统 中 的 用 户 - 物 品 项 (评分 ) 可 以 直接 用 来 对 新 物品 评分 。 这 种 基 
于 近邻 的 方法 以 通过 两 种 著名 的 方法 来 实现 ， 基 于 用 户 或 基于 物品 的 推荐 。 使 用 了 基于 用 
户 算法 推荐 系统 ， 如 GroupLens( 41), Bellcore videol31]# RingoL70]， 评 估 用 户 u 对 物 
品 i 的 感 兴趣 程度 ， 是 通过 利用 对 该 物品 ;已 作 评价 并 且 和 用 户 x 有 相似 评价 习惯 的 其 他 
用 户 ( 也 叫 近邻 ) 。 用 户 u 的 近邻 是 指 与 用 户 评价 很 一 致 的 用 户 ， 如 在 用 户 v 和 用 户 都 
评价 的 物品 中 ( 即 Zw)， 用 户 v MAP u 评价 非常 一 致 。 基 于 物品 方法 L18，47，45] 是 基 
于 用 户 wu 给 相似 于 i 的 物品 评分 来 预测 用 户 给 物品 i 的 评分 。 在 这 种 方法 里 ， 相 似 物 品 
是 指 被 一 些 用 户 评 价 且 具有 相似 特点 的 物品 。 

基于 近邻 系统 是 在 预测 中 直接 使 用 已 有 数据 预测 ， 而 基于 模型 的 方法 是 使 用 这 些 评分 
来 学 习 预 测 模型 。 主 要 思想 是 使 用 属性 构建 用 户 和 物品 之 间 关 联 ， 其 属性 代表 在 系统 中 用 
户 和 物品 的 潜在 特征 ， 如 用 户 喜 爱 的 类 别 和 物品 属于 的 类 别 。 这 种 模型 是 通过 数据 进行 训 
练 的 ， 然 后 为 用 户 预 测 新 的 物品 。 基 于 模型 方法 解决 推荐 任务 有 很 多 ， 其 中 包括 贝 叶 斯 聚 
类 (Bayesian Clustering)[L10]、 潜 在 语义 分 析 (Latent Semantic Analysis)[32]、 潜 在 狄 利 
克 雷 分 布 (Latent Dirichlet Allocation) [9], RA Maximum Entropy)[78], BARB &l 
(Boltzmann Machines)[64]、 支 持 向 量 机 ( Support Vector Machines )[27] 和 奇异 值 分解 
(Singular Value Decomposition)[4，42，57，74，75]。 详 细 描 述 基 于 模型 最 新 进展 的 方 
法 可 以 参考 本 书 的 第 5 章 。 


4.1.3 基于 近邻 方法 的 优势 


尽管 一 些 最 新 研究 显示 最 新 的 基于 模型 的 算法 在 预测 分 数 方面 要 好 于 基于 近邻 的 方法 
[42，73]， 但 是 仅 预 测 精度 高 并 不 能 保证 用 户 得 到 高 效 和 满意 的 体验 [25]。 另 一 个 在 推荐 
系统 中 影响 推荐 用 户 感 兴趣 物品 的 因素 是 惊喜 度 (serendipity)[25，45]， 即 通过 帮助 用 户 
找到 感 兴趣 但 是 本 不 可 能 发 现 的 物品 ， 拓 展 了 新 颖 性 概念 。 例 如 ， 推 荐 给 用 户 一 部 他 喜欢 
的 导演 执导 的 电影 ， 如 果 用 户 没 有 意识 到 要 看 这 部 电影 ， 那 么 这 是 一 个 具有 新 颖 性 的 推 
荐 。 但 这 不 是 一 个 具有 惊喜 度 的 推荐 ， 因 为 用 户 很 有 可 能 会 自己 发 现 这 部 电影 。 

基于 模型 推荐 方法 在 刻画 用 户 爱 好 的 潜在 因素 方面 有 突出 优势 ， 例 如 ， 在 一 个 电影 推 
荐 系统 中 ， 基 于 模型 方法 断定 用 户 是 喜剧 和 浪漫 电影 的 影迷 ， 而 无 须 准 确 区 分 喜剧 和 浪漫 
两 个 维度 。 这 种 方法 能 够 推荐 给 用 户 一 部 他 不 知道 的 浪漫 喜剧 。 但 是 ， 这 种 方法 难以 推荐 
体裁 没有 那么 高 度 一 致 的 电影 ， 例 如 ， 恺 怖 恶搞 喜剧 。 另 一 方面 ， 基 于 近邻 方法 能 够 捕捉 
这 些 数据 的 一 些 关 联 ， 使 用 了 这 种 方法 的 电影 推荐 系统 很 有 可 能 推荐 给 用 户 与 他 平常 品味 
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不 一 样 或 者 不 知名 的 电影 ， 只 要 他 的 近邻 用 户 给 了 这 部 电影 很 强 的 评分 。 这 种 推荐 系统 也 
许 不 能 保证 其 成 功 ， 就 像 推 荐 浪漫 喜剧 那样 ， 但 是 它 可 以 帮助 用 户 发 现 一 些 新 的 体裁 或 者 
一 些 新 的 演员 及 导演 。 
iio a 些 优势 : 
简单 性 : 基于 近邻 推荐 方法 直接 而 且 容 易 实 现 ， 在 其 简单 形式 里 面 ， 仅 有 一 个 参 
数 (用 于 预测 的 近邻 数目 ) 需 要 调整 。 
。 合理 性 : 这 种 方法 对 于 计算 预测 也 提供 了 简洁 并 且 直观 的 理由 。 例 如 ， 在 基于 物 
品 的 推荐 系统 中 ， 近 邻 物品 列表 以 及 用 户 给 予 这 些 物 品 的 评分 ， 都 可 以 提供 给 用 
户 作为 推荐 结果 的 理由 。 这 能 够 帮助 用 户 理解 推荐 结果 及 其 关联 性 ， 并 且 作为 交 
互 系统 的 基础 ; 在 该 系统 中 用 户 能 够 挑选 推荐 结果 中 提示 重要 性 更 高 的 近邻 L4]。 
给 用 户 解释 推荐 的 必要 性 将 在 本 书 的 第 15 SEDE. 
。 高 效 性 ， 选择 基于 近邻 系统 的 一 个 强烈 原因 在 于 它 的 效率 。 大 多 数 基于 模型 的 系 
统 需要 大 量 的 时 间 消 耗 在 训练 阶段 。 由 于 近邻 方法 在 推荐 阶段 需要 比 基 于 模型 方 
法 有 更 大 的 消耗 ， 近 邻 方 法 可 以 在 离线 预先 计算 近邻 ， 提 供 近乎 即时 的 推荐 结果 。 
同时 ， 存 储 近邻 只 需要 很 小 的 内 存 ， 使 得 这 种 方法 很 适合 拥有 大 量 用户 或 者 物品 
的 应 用 。 
。 稳定 性 : 这 种 推荐 系统 拥有 另外 一 个 有 用 的 性 质 就 是 系统 在 用 户 、 物 品 、 评 分 增加 
时 受到 影响 很 小 ， 尤 其 在 大 型 商业 应 用 中 。 例 如 ， 一旦 物品 相似 计算 完成 ， 基 于 物 
品 的 推荐 系统 就 可 以 为 新 用 户 作 推荐 ， 而 不 需要 再 重新 训练 系统 。 同 时 ,一旦 新 的 
物品 的 评分 加 入 ， 仅 仅 需要 计算 该 新 物品 和 系统 已 有 物品 之 间 的 相似 性 即 可 。 


4.1.4 目标 和 概要 


本 章 有 两 个 主要 目标 ， 首 先 可 以 作为 基于 近邻 推荐 系统 的 指南 ， 描 述 了 如 何 实现 推荐 
系统 的 实用 信息 。 特 别 地 ， 这 里 将 会 描述 基于 近邻 推荐 方法 的 主要 组 成 部 分 和 选择 使 用 这 
些 部 分 的 益处 。 其 次 ， 本 章 描述 解决 推荐 系统 一 些 存在 问题 的 具体 方法 ， 如 数据 稀疏 。 尽 
管 对 于 一 些 简单 推荐 系统 来 说 ， 这 些 方法 不 是 必需 的 ， 但 是 对 于 各 种 问题 和 解决 方法 有 一 
个 广阔 的 视角 ， 有 利于 在 实现 推荐 系统 时 做 出 合适 的 决策 。 

本 章 结构 如 下 : 在 4.2 节 中 ， 将 介绍 基于 近邻 方法 对 于 预测 用 户 对 新 物品 评分 的 两 种 
方法 : 回归 和 分 类 ， 以 及 它们 之 间 的 主要 优 缺 点 。 本 章 也 会 介绍 两 种 实现 ， 基 于 用 户 和 基 
于 物品 的 推荐 ， 并 且 会 就 推荐 系统 的 准确 性 、 高 效 性 、 稳 定性 、 可 解释 性 和 惊喜 度 方面 分 
析 这 两 种 实现 。4. 3 节 将 描述 实现 基于 近邻 推荐 系统 的 主要 三 个 组 成 部 分 : 评分 标准 化 、 
相似 度 权重 计算 、 近 邻 的 选择 。 描 述 这 三 部 分 的 最 常用 方法 以 及 对 应 优势 比较 。 在 4.4 节 
中 ， 将 会 介绍 覆盖 率 受 限 和 数据 稀 朴 等 问题 ， 以 及 解决 这 些 问题 的 方法 ， 尤 其 是 基于 降 维 
和 图 的 几 种 技术 。 最 后 ， 将 会 总 结 基 于 近邻 推荐 的 一 些 特点 和 方法 ， 在 实现 这 类 方法 上 给 
予 更 多 的 指示 。 


4.2 基于 近邻 推荐 


基于 近邻 的 推荐 系统 是 根据 相同 “口碑 ”的 准则 ， 即 根据 和 用 户 自 己 兴 趣 相 同 的 人 或 者 
根据 其 他 可 信 源 来 评价 一 个 物品 (电影 、 书 籍 、 文 章 、 相 册 等 )。 为 了 说 明 这 种 方法 ， 我 们 
举 一 个 评分 的 例子 ， 如 图 4. 1 所 示 。 
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图 4.1 显示 四 个 用 户 对 五 部 电影 评价 的 小 例子 


用 户 Eric 需要 决定 是 否 租用 他 没有 看 过 的 电影 “Titanic”。 他 知道 Lucy 在 电 
影 上 和 他 有 相同 的 品味 ， 他 们 都 不 喜欢 “The Matrix” 而 都 喜欢 “Forrest Gump”， 所 以 他 询 
问 她 对 于 这 部 电影 的 观点 。 另 一 方面 ，Eric 发 现 Diane 和 自己 有 不 同 的 品味 ，Diane BK 
他 不 喜欢 的 动作 类 电影 ， 所 以 他 忽视 她 的 观点 ， 或 者 考虑 和 她 相反 的 观点 来 做 出 选择 。 « 


4.2.1 基于 用 户 评分 


基于 近邻 用 户 推荐 方法 预测 用 户 u 对 新 物品 i 的 评分 ~* ， 是 利用 和 用 户 uw 兴趣 相近 且 

对 物品 i 作 了 评分 的 用 户 ， 这 些 和 用 户 x 兴趣 相近 的 用 户 称 为 近邻 。 假 设 用 wo RRA u 
Tü 的 兴趣 相近 程度 (如 何 计算 这 种 相近 程度 会 在 4. 3. 2 节 讨 论 )。 用 户 u 的 上 近邻 ， 即 天 
个 与 用 户 WUE wm 最 高 的 用 户 v 可 以 表示 为 NV(u)。 同 时 在 这 些 用 户 中 只 有 对 物品 i 作 
了 评分 的 用 户 才 能 够 用 于 预测 评分 x。， 所 以 我 们 考虑 使 用 & 个 和 用 户 u 兴趣 相近 且 对 物品 
i 已 作 评 分 的 用 户 代替 原来 的 & 近邻 定义 ， 并 写作 ;Cu)。 因 此 预测 评分 ri 可 以 利用 这 些 
近邻 对 物品 i 的 平均 评分 策略 获得 
^ 1 


Le 


" (4. 7) 


式 (4.7) 评 分 公式 存在 着 没有 考虑 用 户 u 和 每 个 近邻 用 户 对 物品 评分 相近 程度 不 一 的 问题 。 
再 次 回 到 图 4. 1 的 例子 : 假设 Eric 有 两 个 近邻 分 别 是 Lucy 和 Diane， 如 果 对 电影 “Titanic” 评 
分 平均 地 依靠 她 们 的 评分 是 不 合理 的 ， 因 为 Lucy 的 品味 和 Eric 更 相近 。 对 于 此 类 问题 一 
个 通用 解决 方法 就 是 根据 和 用 户 x 的 兴趣 相近 程度 进行 加 权 。 但 是 这 些 权重 总 和 不 为 1， 
这 样 预测 的 评分 可 能 会 超出 评分 标准 的 范围 。 因 此 ， 我 们 可 以 标准 化 这 些 权 重 ， 这 样 预测 
评分 的 准则 就 变 成 如 下 表示 : 


和 三 v€ N ; Cu) (4. 8) 


围 。 同 样 地 ， 可 以 用 ws, 代替 ww,,。， 其 中 a0 是 放大 因子 [10]。 就 像 经 常 采用 的 那样 ， 当 
a 之 1 时， 与 用 户 * 最 接近 的 用 户 ( 评 分 ) 就 越 重 要 。 

假设 我 们 使 用 式 (4. 8) 来 预测 Eric 对 电影 “Titanic” 评 分 ， 这 里 会 使 用 到 Lucy 
和 Diane 这 两 个 近邻 用 户 对 于 这 部 电影 评分 。 进 一 步 假设 这 些 近邻 与 Eric 相近 权重 分 别 是 
0.75 和 0.15。 那 么 这 个 预测 评分 为 


_ 0.75X5+0.15X3 
0.75 十 0.15 


这 个 评分 更 接近 Lucy 而 不 是 Diane。 < 
式 (4. 8) 同 样 有 个 严重 的 缺陷 :这 种 方法 没有 考虑 用 户 会 使 用 不 同 的 评分 尺度 来 衡量 
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他 们 对 于 相同 喜欢 程度 的 物品 。 例 如 ， 一 个 用 户 也 许 只 会 给 很 少量 突出 的 物品 最 高 分 ， 而 
另 一 些 用 户 则 会 对 自己 喜欢 的 物品 都 给 予 最 高 分 。 解 决 这 个 问题 可 以 将 近邻 评分 ri; 进行 
标准 化 转换 h(r,)[10，60]， 可 以 得 到 以 下 预测 式 子 : 


by Wr lh Gy) | 


v€ Nu) 


b» | war | 


需要 注意 的 是 这 样 的 预测 评分 需要 转换 原始 测度 ， 因此 将 在 式 子 中 用 到 h“'。 最 常用 的 标 
准 化 评分 方法 将 在 4. 3. 1 节 讲 述 。 


4.2.2 基于 用 户 分 类 


前 面 所 描述 的 预测 方法 是 通过 对 近邻 用 户 评分 进行 加 权 平 均 的 计算 方法 ， 本 质 上 是 在 
解决 回归 问题 。 另 一 方面 ， 基 于 近邻 的 分 类 则 是 通过 用 户 uc 的 最 近邻 对 于 评分 的 投票 ， 找 
HAP u 对 物品 i 最 有 可 能 的 评分 。 用 户 wu 的 & 个 最 近邻 对 评分 r(r€ s) 的 投票 w 可 以 计 
为 对 物品 i 评分 的 所 有 近邻 的 相似 度 权 重 的 总 和 : 

v, = >) 8r, = rw, (4. 10) 


VENi Co 
如 果 六 = 一 r， 则 60 一 门 为 1， 和 否则 为 0。 如 果 每 个 可 能 的 评分 值 都 计算 过 了 ， 则 只 要 找 
出 必 最 大 的 那个 > 就 是 预测 出 的 评分 值 。 

再 次 假设 Eric 的 两 个 近邻 Lucy 和 Diane 的 相似 权重 分 别 为 0.75 和 0. 15。 在 
这 个 例子 中 ， 评 分 5 和 评分 3 都 有 一 次 投票 。 因 为 Lucy 的 投票 相对 于 Diane 的 投票 有 着 
更 大 的 权重 ， 所 以 预测 评分 是 ?二 5。 4 

同样 可 以 对 考虑 了 标准 化 评分 的 分 类 方法 进行 定义 : 令 s' 表 示 为 可 能 的 已 经 标准 化 的 
值 的 集合 (可 能 需要 经 过 离散 化 处 理 )， 预 测 分 数 可 以 定义 为 

fa =h (argmax > ó(hCr4) = 1) wy ) (4. 11) 


VE N (uw) 


Pai = h' 


(4. 9) 





4.2.3 回归 与 分 类 


选择 基于 近邻 回归 或 者 分 类 方法 很 大 程度 取决 于 系统 的 评分 刻度 (scale) 类 型 。 因 此 ， 
如 果 一 个 评分 刻度 是 连续 的 ， 如 Jester 笑话 推荐 系统 [23] 中 的 评分 可 以 在 一 10 到 10 之 间 
取 任 意 值 ， 那 么 回归 方法 更 加 适合 。 相 反 ， 如 果 评 分 刻度 仅 是 一 些 离散 的 值 ， 如 “好 ” 
“ 差 ”， 抑 或 者 是 数值 没有 明显 排序 ， 那 么 分 类 方法 应 该 会 更 加 适合 。 另 外 ， 因 为 标准 化 方 
法 会 使 评分 映射 到 连续 类 型 ， 这 就 导致 分 类 方法 很 难处 理 这 类 问题 。 

还 有 一 种 办 法 可 以 比较 这 两 种 方法 ， 就 是 假设 所 有 近邻 的 相似 度 权 重 都 相同 。 当 用 
于 顶 测 的 近邻 数 增加 时 ， 回 归 方 法 预测 的 分 数 rs 将 趋向 于 物品 i 的 评分 的 平均 数 。 假 设 
物品 i 的 评分 仅 在 评分 范围 的 极端 ， 如 喜欢 或 者 厌恶 ， 那 么 回归 方法 将 会 是 一 个 保险 的 
决策 ， 使 得 物品 的 分 值 较为 平均 。 从 统计 观点 出 发 ， 这 也 是 合理 的 ， 因 为 期 望 评分 (也 
就 是 预测 评分 ) 是 能 最 小 化 RMSE 的 分 值 。 另 一 方面 ， 分 类 方法 将 会 用 对 物品 i 最 频繁 
的 评分 作为 预测 评分 ， 这 也 是 最 冒险 方法 ， 因 为 物品 要 么 标示 成 “好 ”或 者 要 么 标示 
“W”. 但是， 正如 前 面 所 提 到 的 ， 选 择 冒 险 的 方法 也 是 非常 有 吸引 力 的 ， 因 为 这 样 会 产 
生 惊 喜 度 的 推荐 。 
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4.2.4 基于 物品 推荐 


基于 用 户 的 推荐 方法 是 依赖 于 和 自己 兴趣 相同 的 用 户 来 预测 一 个 评分 ， 而 基于 物品 的 推 
荐 方法 [18，47，45] 是 通过 评分 相近 的 物品 来 预测 。 让 我 们 通过 以 下 例子 来 说 明 这 种 方法 。 

与 咨询 同伴 不 同 ，Eric 通过 他 已 经 看 过 的 电影 来 决定 电影 “Titanic” 是 否 适合 
他 。 他 发 现 对 这 部 电影 评分 的 人 对 于 电影 “Forrest Gump” 和 “Wall-E” 给 予 相近 的 评分 。 因 
为 Eric 也 喜欢 这 两 部 电影 ， 所 以 他 认为 自己 也 会 喜欢 “Titanic”。 4 

这 种 方法 描述 如 下 : ELN ORAP u 已 经 评分 且 和 物品 ; 评分 相近 的 物品 。 用 户 z 
对 物品 i 的 预测 评分 可 以 通过 对 用 户 N, (Ci) 中 物品 的 评分 进行 加 权 平 均 运算 : 


jy s (4. 12) 


“Wall-E” 的 相似 权重 分 别 为 0. 85 和 0. 75。 因 为 Eric 对 这 两 部 电影 评分 分 别 是 5 和 4, 

此 预测 评分 可 以 计算 为 

_0.85X5 十 0.75X4 
0. 85 +0. 75 


不 同 用 户 有 自己 的 独立 评分 尺度 ， 所 以 考虑 使 用 h 对 评分 标准 化 : 
» wh Cry) 


JEN, 


2: |w | 


JEN, 


此 外 ， 我 们 也 可 以 定义 基于 物品 分 类 的 方法 。 在 这 种 情况 下 ， 用 户 “评分 的 物品 7 会 
决定 另 一 个 物品 i 的 评分 ,而 且 这 种 决定 权 会 根据 i 和 j 之 间 的 相似 度 加 权 。 这 个 方法 的 
标准 化 版 本 如 下 : 


za 4. 53 


^ 


Ca = R^ 


(4. 13) 








(4. 14) 


P, =A (argmax >, 6(A(ry) = Dw;) < 
res 


4.2.5 基于 用 户 和 基于 物品 推荐 的 对 比 


当 需 要 选择 是 基于 用 户 还 是 基于 物品 近邻 方法 来 实现 推荐 系统 的 时 候 ， 有 五 个 准则 需 
要 考虑 : 
。 准确 性 : 推荐 系统 的 准确 度 很 大 程度 依赖 于 系统 中 用 户 数 与 物品 数 之 间 的 比例 。 
如 4.3.2 节 描 述 ， 基 于 用 户 方法 决定 用 户 的 近邻 数 的 相似 度 计 算是 通过 比较 这 些 
用 户 对 相同 物品 评分 。 假 设 一 个 系统 有 1000 个 用 户 对 100 个 物品 的 10 000 个 评 
分 ， 为 了 便于 分 析 ， 假 设 这 些 评分 是 标准 分 布 的 ?> 。 从 表 4. 1 可 以 得 到 平均 有 650 
个 用 户 可 以 成 为 潜在 近邻 。 然 而 用 于 计算 相似 度 的 共同 评分 数量 仅 为 1。 另 一 方 
面 ， 基 于 物品 方法 计算 相似 度 比较 同一 个 用 户 对 两 个 不 同 物品 评分 。 再 次 假设 这 
些 评分 是 符合 标准 分 布 的 ， 我 们 可 以 发 现 潜在 近邻 的 平均 个 数 是 99， 可 以 用 于 计 


加” 真实 数据 中 评分 分 布 通常 是 偏 态 的 ， 也 就 是 说 ， 大 多 数 评分 都 落 在 一 小 部 分 物品 上 。 
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算 相似 度 的 评分 平均 个 数 是 10。 


表 4.1 基于 用 户 和 基于 物品 近邻 方法 中 分 别 用 于 计算 相似 性 的 近邻 平均 数量 和 评分 平均 数量 。 
假设 评分 是 正 态 分 布 的 ， 每 个 用 户 的 平均 评分 数 是 p= | 及 |/|zx| ， 每 个 物品 的 平均 评 
28 q7 In|/|zl 


dul -»- (HLIT5)) 


z|-p(1-( 





评分 平均 数量 










通常 ， 一 小 部 分 高 可 信和 度 的 用 户 要 比 一 大 部 分 相似 度 不 是 那么 可 信 的 近邻 要 
适合 得 多 。 对 于 用 户 数 量 远 远 大 于 物品 数量 的 大 型 商业 系统 ， 如 Amazon. com, 
基于 物品 的 推荐 方法 更 加 准确 L19，45]。 同 样 ， 用 户 数 少 于 物品 数 的 系统 ， 如 科 
研 论文 推荐 系统 只 有 几 千 名 用 户 ， 但 却 有 成 千 上 万 的 论文 要 推荐 ， 可 能 采用 基于 
用 户 的 近邻 方法 会 更 有 益 [25] 。 
效率 : 如 表 4. 2 所 示 ， 推 荐 系统 的 内 存 和 计算 效率 也 依赖 用 户 数量 和 物品 数量 的 
比例 。 因 此 当 用 户 数量 远 远大 于 物品 数量 时 ， 基 于 物品 推荐 方法 在 (训练 阶段 ) 计 
算 相 似 度 权 重 方面 所 需 的 内 存 和 时 间 要 远 远 小 于 基于 用 户 的 方法 。 但 是 ， 在 线 推 
荐 阶段 的 时 间 复 杂 度 因为 只 依赖 有 效 的 物品 数 和 近邻 数 的 最 大 值 ， 所 以 对 于 基于 
用 户 和 基于 物品 方法 来 说 是 相同 的 。 


表 4.2 基于 用 户 和 基于 物品 的 近邻 推荐 方法 的 空间 复杂 度 及 时 间 复 杂 度 ， 其 函数 包括 三 个 变 
量 ， 分 别 是 为 每 个 用 户 的 评分 数 最 大 值 p=max, | T, | 、 每 个 物品 的 评分 数 最 大 值 q= 
max, | zi, | 和 评分 预测 中 用 到 的 近邻 个 数 最 大 值 k 


时 间 复杂 度 
空间 复杂 度 naa 


ane 
JAE 





在 实际 中 ， 计 算 相 似 权 重要 远 远 小 于 表 4 2 所 描述 最 坏 情况 的 计算 复杂 度 ， 原 
因 在 于 用 户 仅 有 效 评价 少量 的 物品 。 根 据 这 种 情况 ， 仅 那些 非 零 的 相似 权重 需要 被 
存储 下 来 ， 这 样 就 远 远 小 于 用 户 之 间 成 对 的 数量 。 这 些 存 储 数 量 可 以 进一步 通过 存 
储 最 大 N 权重 (N 为 参数 ) 来 减少 数量 [45]。 同 样 地 ， 不 用 测试 每 对 用 户 或 物品 可 以 
有 效 地 计算 非 零 权重 ， 这 使 得 近邻 方法 对 非常 大 型 的 系统 更 具有 可 扩展 性 。 
稳定 性 : 选择 基于 用 户 或 者 基于 物品 方法 也 依赖 用 户 或 者 物品 的 改变 频率 和 数量 。 
如 果 系 统 中 有 效 物品 的 列表 比 用 户 相 对 稳定 ， 那 么 基于 物品 的 推荐 方法 可 能 更 适 
用 ， 因 为 物品 相似 度 依然 能 够 用 于 推荐 物品 给 新 的 用 户 。 相 反 ， 当 应 用 物品 的 列 
表 经 常 改变 ， 如 文字 推荐 系统 ， 基 于 用 户 的 方法 会 更 加 稳定 。 
合理 性 : 基于 物品 的 推荐 方法 的 优点 是 易于 证 明 推 荐 的 合理 性 。 因 此 ， 预 测 中 用 
到 的 近邻 物品 列表 ， 以 及 它们 的 相似 度 权 重 ， 都 可 以 作为 推荐 结果 的 解释 提供 给 
用 户 。 通 过 修改 近邻 列表 及 其 权重 ， 使 用 户 在 推荐 过 程 中 参与 交互 成 为 可 能 。 但 
是 ， 基 于 用 户 的 方法 就 很 难 做 到 这 点 ， 因 为 活路 用户 不 知道 在 推荐 结果 中 起 到 近 
邻 作 用 的 其 他 用 户 。 
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。 REE: 对 于 基于 物品 推荐 方法 来 说 ， 对 于 物品 评分 预测 是 基于 评分 相似 的 物品 。 
这 样 ， 推 荐 系统 推荐 一 个 物品 给 用 户 ， 这 个 物品 通常 已 经 用 户 喜 欢 的 类 型 。 例 如 ， 
在 电影 推荐 应 用 中 ， 具 有 相同 体裁 、 演 员 或 者 导演 的 电影 会 非常 可 能 推荐 给 用 户 。 
这 种 方法 可 以 产生 安全 的 推荐 ， 但 是 这 种 方法 难以 帮助 用 户 发 现 他 也 可 能 非常 喜 
欢 的 其 他 不 同类 型 物品 。 

另 一 方面 ， 因 为 是 根据 用 户 相似 度 来 进行 的 ， 基 于 用 户 的 方法 可 以 产生 更 加 
新 颖 的 推荐 。 当 推荐 是 基于 很 小 部 分 近邻 数 的 时 候 尤 为 有 效 。 例 如 ， 用 户 A 仅 因 
为 几 部 喜剧 电影 和 用 户 B 相似 ， 但 是 用 户 B 又 喜欢 不 同体 裁 的 电影 ， 这 样 也 会 有 
可 能 因为 A 和 B 相似 而 把 这 类 电影 推荐 给 A。 


4.3 近邻 方法 的 要 素 


在 前 面 几 节 已 经 看 到 ， 选 择 回 归 或 者 分 类 ， 以 及 选择 基于 用 户 还 是 基于 物品 的 方法 ， 
都 会 对 推荐 系统 的 准确 性 、 效 率 和 整体 质量 产生 重要 影响 。 除 了 这 些 重要 的 属性 ， 在 推荐 
系统 的 实现 中 还 有 三 个 非常 重要 的 因素 需要 考虑 : 1) 评 分 标准 化 ; 2) 相 似 度 权重 的 计算 ; 
3) 近 邻 的 选择 。 下 面 介绍 一 些 关于 这 三 类 问题 的 通用 方法 ， 描 述 主要 的 优 缺 点 ， 以 及 如 何 
去 实现 它们 。 


4.3.1 评分 标准 化 


当 一 个 用 户 对 一 个 物品 给 予 评 分 的 时 候 ， 每 个 用 户 都 有 自己 的 评价 准则 。 即 使 显 式 地 定 
义 每 个 评分 的 意义 (如 1 表示 强烈 不 同意 ，2 表示 不 同意 ，3 表示 中 立 等 )， 有 些 用 户 依然 会 
不 情愿 给 他 们 喜欢 的 物品 评 高 分 或 给 他 们 不 喜欢 的 物品 评 低 分 。 均 值 中 心 化 (mean-centering) 
和 Z-score 这 两 种 通用 的 标准 化 机 制 可 以 将 个 人 评分 标准 转换 到 更 一 般 的 整体 评分 标准 。 
4.3.1.1 均值 中 心 化 

均值 中 心 化 方法 [10，60] 的 思想 就 是 通过 与 平均 分 的 比较 来 决定 一 个 评分 为 正 或 者 为 
负 。 在 基于 用 户 推荐 系统 中 ， 设 ri 为 用 户 对 物品 i 的 原始 评分 ， 可 以 通过 减 去 他 评价 的 所 
有 物品 的 平均 分 元 ， 转 化 为 均值 中 心 化 评分 : 


hrs) = fi ` Tu 


可 以 用 下 式 来 预测 用 户 评分 ra: 
bb Way (Tu — Tv) 
2 =F, uEN (uw) (4.15) 
| 
v€ X, Cu) 
同样 ， 基 于 物品 来 说 ，r 的 均值 中 心 化 评分 也 可 以 这 样 得 
h(r4) = r4 —ri 


其 中 ，F 表示 用 户 集合 u; 对 物品 i 的 平均 评分 。 这 种 标准 化 技术 通常 用 在 基于 物品 推 
X: wy (ry — rj) 
Roc 4 Je, (4.16) 
’ > | w | 
JEN, (CD 


中 心 化 均值 方法 有 个 有 趣 的 性 质 就 是 : 用 户 对 物品 喜好 倾向 可 以 直接 观察 标准 化 后 的 
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评分 值 的 正 负 情 况 。 同 时 评分 可 以 表示 用 户 对 该 物品 喜好 或 厌恶 的 程度 。 

如 图 4.2 所 示 ， 尽 管 Diane 给 予 电 影 “Titanic” 和 “Forrest Gump” 的 评价 分 数 
X 34r, 但 是 用 户 的 平均 中 心 化 评分 结果 却 显 示 其 对 于 这 些 电 影 的 偏好 是 负 值 。 这 是 因为 
她 的 评分 总 体 上 高 于 所 有 用 户 的 整体 平均 分 ， 所 以 物体 的 平均 分 对 她 来 说 表示 不 感 兴 趣 。 
两 种 均值 中 心 化 方法 的 区 别 也 可 以 对 比 出 来 。 例 如 ，Diane 对 “Titanic” 的 物品 均值 中 心 化 
评分 是 中 立 而 非 否 定 的， 原因 在 于 大 多 数 用 户 对 这 部 电影 的 评分 都 较 低 。 同 样 地 ， 在 物品 
均值 中 心 化 评分 中 ，Diane 对 于 电影 “The Matrix” 的 喜欢 程度 以 及 John X} F “Forrest 
Gump” 的 不 喜欢 程度 要 更 加 强烈 。 











































用 户 均 值 中 心 化 
[ 19 o9 |] c9» .] 
物品 均值 中 心 化 
e e 
图 4.2 用 户 和 物品 的 均值 中 心 化 评分 4 


4.3.1.2 Z-score 标准 化 

考虑 这 种 情况 : 用户 A 和 用 户 B 平均 评分 都 是 3， 但 是 假设 用 户 A 的 评分 在 1 到 5 之 
间 轮 流 选择 ， 而 用 户 B 则 都 是 3。 如 果 用 户 B 给 物品 评 5 分 ， 这 会 比 用 户 A 给 物品 评 5 分 
更 加 意外 ， 因 此 反映 了 用 户 B 更 加 喜爱 这 个 物品 。 均 值 中 心 化 方法 移 除 了 针对 平均 评分 的 
不 同感 受 而 导致 的 偏差 ， 而 Z-score 标准 化 [29] 方 法 则 还 考虑 了 个 人 评分 范围 不 同 带 来 的 
差异 性 。 同 样 ， 这 种 方法 在 基于 用 户 方法 和 基于 物品 方法 之 间 也 有 差异 。 在 基于 用 户 方法 
中 ， 标 准 化 评分 等 于 用 户 均值 中 心 化 评分 除 以 用 户 评 分 标准 差 6 : 
Yu 


h(ry) = H 
c 


因此 ， 基 于 用 户 的 预测 评分 rw 可 以 通过 下 式 计算 ， 
> Wuv ng —7,)/0, 


v€ A (GQ0 


$3 | ww | 


同样 地 ， 基 于 物品 方法 使 用 Z-score 标准 化 + 是 通过 物品 均值 中 心 化 评分 除 以 物品 评 
分 的 标准 差 得 到 ， 


f, =F, +O, (4. 17) 


hry) = AE 


因此 ， 基 于 物品 的 预测 评分 rw 可 以 通过 下 式 计算 ， 
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ws wi (rs —7;)/6; 


J€ N,O 


22 | wy | 


JEN, D 


(4. 18) 


4.3.1.3 选择 一 个 标准 化 方法 


对 一 些 例子 ， 评 分 标准 化 可 能 会 产生 意料 之 外 的 效果 。 例 如 ， 假 设 一 个 用 户 只 给 他 买 
过 的 物品 打 最 高 分 ， 那 么 平均 中 心 化 方法 会 认为 这 个 用 户 “ 容 易 满足 >， 那么 所 有 低 于 最 高 
评分 的 (不 管 是 正 的 还 是 负 的 评分 ) 都 会 被 考虑 为 负 分 。 但 是 这 个 用 户 事实 上 可 能 是 “难以 
伺候 ”并 谨慎 地 选择 一 些 他 确定 喜欢 的 物品 。 所 以 ， 对 少量 评分 进行 标准 化 可 能 会 产生 不 
可 预测 的 结果 。 例 如 ， 如 果 一 个 用 户 只 是 给 予 一 个 评分 或 者 几 个 相同 的 评分 ， 那 么 他 评分 
的 标准 差 将 会 是 0， 这 就 导致 一 个 不 可 定义 的 预测 值 。 尽 管 如 此 ， 只 要 评分 数据 不 是 极度 
稀 玻 的 ， 标 准 化 评分 的 方法 还 是 可 以 改进 预测 的 [29，33] 。 

对 比 均值 中 心 化 和 Z-score 方 法 ， 如 前 面 描述 ， 后 者 因为 考虑 了 基于 用 户 或 物品 评分 
的 方差 而 具有 额外 优势 。 特 别 是 ， 在 处 理 范围 很 大 的 离散 评分 或 者 连续 值 评 分 时 尤为 有 
用 。 男 一 方面 ， 因 为 Zscore 方法 除 以 了 评分 的 标准 差 值 ， 所 以 它 比 均值 中 心 化 方法 更 加 
敏感 ， 用 它 预 测 的 评分 经 常会 超过 评分 范围 。 最 后 ， 尽 管 早先 研究 L29] 中 的 结论 是 均值 中 
心 化 和 Z-score 方法 的 结果 相似 ， 更 新 的 研究 L33] 显 示 Z-score 方法 还 是 具有 额外 优势 的 。 

如 果 标 准 化 方法 不 太 可 能 或 者 不 能 改进 结果 ， 另 一 种 可 行 的 解决 方法 就 是 基于 偏好 的 
过 滤 (preference-based filtering) 方 法 。 相 对 于 关注 评分 绝对 值 ， 这 种 方法 更 关注 预测 用 户 
的 相对 偏好 ， 因 为 评分 的 范围 不 改变 对 物品 的 偏好 次 序 ， 所 以 对 相对 偏好 的 预测 并 不 需要 
标准 化 评分 。 以 下 文献 介绍 了 这 种 方法 L13，21，37，36] 。 


4.3.2 相似 度 权 重 计 算 


相似 度 权 重 在 基于 近邻 的 推荐 方法 中 扮演 双重 角色 : 1) 可 以 用 于 选择 可 信 的 近邻 用 于 
预测 评分 ; 2) 给 予 不 同 近邻 在 预测 中 的 权重 。 计 算 相似 度 权重 是 基于 近邻 推荐 系统 中 最 重 
要 的 一 个 方面 ， 它 可 以 直接 影响 准确 性 和 性 能 。 
4.3.2.1 基于 关联 的 相似 度 

在 信息 检索 中 经 常 这 样 计算 对 象 a, b 之 间 的 相似 度 : 首先 将 a 和 4。 表示 成 向 量 形式 
(x。，xs)， 然 后 计算 两 向 量 间 的 余弦 向 量 (或 向 量 空间 ) 相 似 度 : 

xix, 

X, 

在 基于 物品 的 推荐 系统 中 ， 这 种 方法 改 为 计算 用 户 的 相似 性 ， 将 用 户 u 表示 为 一 个 向 
量 x,.ERI'| ,其 中 x 二 ri 为 用 户 u 对 物品 i 的 评分 ，0 表示 没有 评分 。 那 么 用 户 x 和 w 之 
间 的 相似 度 可 以 这 样 计算 : 

Mr 


CV(u,v) = cos(x,,X,) = —— ——— (4. 19) 

其 中 1 表示 同时 被 用 户 x 和 w 都 评分 的 物品 。 这 种 方法 存在 一 个 问题 在 于 它 没 考虑 
AP w 和 w 的 评分 均值 以 及 方差 间 的 差异 。 

一 个 常用 的 可 以 除去 均值 和 方差 间 差 异 影 响 的 方法 是 皮尔 逊 相似 度 (Pearson Correla- 


cos(x, Xa) = 
X, 
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tion, PC); 


SD (ru 一 元 )(ru 一 元 ) 
PC(u,v) = ——— (4. 20) 


M (ra 一元) >，(ru — 7)? 
i€Z,, ie. 


注意 这 和 先进 行 Z-score 标准 化 评分 ， 然 后 计算 余弦 相似 度 是 不 同 的 : 皮尔 逊 相似 度 
仅 考虑 了 用 户 评分 交集 的 标准 差 ， 而 不 是 全 部 。 同 样 的 方法 可 以 用 于 计算 物品 ; 和 ,7 的 相 
似 度 [18，45]， 基 于 评分 用 户 的 交集 ; 
2 Gs nns —7) 


ue us 
5 Gran b (rg =T 
u€ us uus 
其 中 正 负 号 表示 关联 的 同 向 或 相反 性 ， 其 值 表示 关联 的 强度 。 
图 4. 3 给 出 了 用 户 和 物品 间 皮 尔 逊 相似 度 的 计算 : 我 们 可 以 看 到 ，Lucy 的 电影 
品味 和 Eric 很 接近 (相似 度 为 0.922)， 但 与 John 则 非常 不 同 ( 相 似 度 为 一 0.938) 。 这 就 意味 
着 Eric 的 评分 可 以 用 来 预测 Lucy 的 评分 ,但 是 Lucy 与 John 的 评分 不 相关 或 者 干脆 相反 。 
我 们 也 同时 可 以 发 现 喜 欢 电影 The Matrix” 的 人 同时 喜欢 “Die Hard” 但 是 厌恶 “Wall-E”。 值 得 
注意 的 是 ， 这 些 关 联 的 发 现 并 没 依赖 任何 关于 电影 体裁 、 导 演 和 演员 的 信息 。 
基于 用 户 的 皮尔 逊 相似 度 
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基于 物品 的 皮尔 逊 相似 度 








PC(i,7) = (4. 21) 



























Matrix 
Titanic 

Die Hard 
Forrest Gump 
Wall-E 






—0. 974 0. 931 — 0. 804 1. 000 
—0. 977 0. 994 — 1. 000 0. 930 


图 4.3 用 户 和 物品 PC 相似 性 评分 4 

用 户 间 评分 的 方差 要 明显 大 于 物品 间 的 评分 ， 因 此 计算 物品 间 相 似 度 时 ， 相 比 于 用 物 

品 均值 中 心 化 ， 用 户 均值 中 心 化 更 加 适合 。 调 整 的 余弦 相似 度 (Adjusted Cosine，AC) 就 
是 这 样 : 






SD Gra — 7) ry 一 元 ) 


ACG;j) = 





«Eu; “Eu; 
在 一 些 基 于 物品 的 例子 中 ， 用 调整 的 余弦 相似 度 算 法 所 作 的 预测 要 好 于 皮尔 逊 相似 度 
算法 [45]。 
4.3.2.2 ”其 他 的 相似 度 权重 计算 方法 
下 面 是 一 些 其 他 的 相似 度 算法 : 均 方 差 (Mean Squared Difference，MSD)[70] 是 使 用 
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用 户 和 w 对 相同 物品 评分 差 的 平方 总 和 均值 的 倒数 表示 两 个 人 的 相似 度 : 
Tal 
MSD(u,v) = te —_ (4. 22) 
21 


Gu — Ty a 
iC Tio 


尽管 这 种 方法 经 过 修改 可 用 来 计算 两 组 标准 化 评分 的 差异 ， 与 皮尔 逊 相似 度 相 比 ， 
MSD 算法 不 能 表示 用 户 偏好 的 负 关 联 ， 或 者 对 不 同 物品 的 喜好 程度 。 而 包含 这 种 负 关 联 
可 能 提高 预测 的 准确 度 [28j。 

男 一 种 有 名 的 相似 度 算法 是 斯 皮尔 曼 等 级 关联 (Spearman Rank Correlation, SRC) 
[39j。 和 皮尔 逊 方法 直接 运用 评分 值 不 同 ， 斯 皮尔 曼 等 级 关联 考虑 运用 这 些 评分 的 排名 。 
定义 As 为 物品 ; EAP u 所 评分 物品 中 的 排 位 (并 列 评分 用 它们 的 平均 排名 )， 则 用 户 w 和 
v 的 相似 度 可 以 这 样 计算 : 

D>) ks — Ba) Cku —E,) 


SRC(u,v) = — e —————— (4. 23) 
Sd) Gs — Ba)? 3G, — By)? 
i i€ Tuv 


其 中 ，& 是 用 户 所 评价 物品 的 平均 排名 。 

斯 皮尔 曼 等 级 关联 算法 的 主要 优势 在 于 排名 可 以 绕 开标 准 化 评分 的 问题 。 而 当 用 户 评 
分 只 有 少量 可 选 值 的 时 候 ， 这 种 方法 不 是 最 好 的 ， 原 因 在 于 它 会 产生 大 量 的 并 列 排名 。 同 
时 由 于 需要 排序 ， 它 的 消耗 要 明显 大 于 皮尔 逊 关联 算法 。 

# 4.3 显示 了 MSD, SRC 和 PC 方法 在 MovieLens 9 数据 集 [28] 上 基于 用 户 预 测 的 准 
确 度 (MAE)， 给 出 了 不 同 & 值 的 结果 (k 表示 预测 时 取 的 最 大 近邻 数 ) 。 我 们 发 现 可 能 是 由 
于 没有 考虑 到 负 关 联 ，MSD 得 到 的 预测 准确 度 是 最 低 的 。 同 时 发 现 PC 方法 比 SRC 方法 
准确 度 要 高 一 点 。 尽 管 PC 方法 通常 被 认为 是 最 优 的 相似 度 计算 方法 [28]， 但 是 最 近 一 些 
研究 显示 ， 这 些 算 法 的 效果 很 大 程度 依赖 于 数据 本 身 [33] 。 


表 4.3 随 着 近邻 k 数目 的 预测 结果 





4.3.2.3 关于 重要 性 的 说 明 

在 系统 中 ， 由 于 评分 数据 相对 于 用 户 数 或 物品 数 通常 是 稀 朴 的 ， 相 似 度 也 仅 是 通过 很 
少 一 部 分 对 相同 物品 的 评分 或 者 同一 用 户 所 做 的 评分 来 计算 获得 。 例如， 系统 中 有 1000 
个 用 户 对 100 个 物品 的 10 000 个 评分 (假设 满足 均匀 分 布 )。 表 4. 1 是 通过 比较 他 们 共同 评 
价 的 一 个 物品 而 计算 出 的 两 个 用 户 的 相似 度 。 如 果 这 几 个 评分 都 是 相等 的 ， 那么 这 些 用 户 
则 被 视 为 “完全 相似 ”并 且 在 互相 推荐 中 起 到 非常 重要 作用 。 但 是 如 果 这 些 用 户 的 爱好 事实 
上 是 不 同 的 ， 就 会 导致 一 个 不 好 的 推荐 。 


Q http://www. grouplens. org/ 
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人 们 提出 了 一 些 考虑 加 入 相似 度 权重 重要 性 (significance) 的 策略 ， 这 些 策略 的 本 质 是 
一 样 的 ， 当 只 有 少量 评分 用 于 计算 时 ， 就 会 降低 相似 度 重 要 性 的 权重 。 

例如 ， 在 重要 性 权重 (Significance weighting) 里 [29，49]， 当 两 人 共同 评分 的 物品 数 
Tw 小 于 给 定 的 参数 7 二 0 时 ， 他 们 的 相似 度 zw 会 受到 与 7 成 比例 的 惩罚 ， 公 式 如 下 : 


wie mL yu, (4. 24) 


同样 ， 对 于 共同 评分 用 户 过 少 的 物品 间 相 似 度 W; ， 也 可 以 这 样 调整 为 


wi, = mnie Lr X Wy (4. 25) 


在 文献 中 [29，28] 发 现 y2525 可 以 显著 地 提高 预测 评分 的 准确 性 ， 其 中 y 为 50 的 时 候 可 
以 获得 最 好 的 结果 。 由 于 最 优 参数 值 是 依赖 于 数据 本 身 的 ， 应 该 使 用 交叉 验证 方法 来 决定 。 
重要 性 权重 方法 的 一 个 特点 就 是 ， 当 一 个 权重 需要 调整 的 时 候 需 要 使 用 阅 值 y RR 
定 。 文 献 L4j 描 述 了 一 个 更 加 连续 的 方法 ， 这 种 方法 基于 “收缩 ”概念 。 这 种 方法 使 用 贝 叶 
斯 观点 来 解释 ， 一 个 参数 的 最 优 估 计 是 后 验 均值 ， 对 应 参数 的 先 验 均值 ( 空 值 ) 和 完全 基于 
数据 的 经 验 估计 量 的 线性 组 合 。 在 这 种 情况 下 ， 要 预 估 的 参数 就 是 相似 度 权 重 ， 空 值 为 
零 。 因 此 一 个 在 少量 评分 情况 下 的 用 户 相 似 性 权重 估计 可 以 这 样 表 示 : 
i EN 
^ Mni 
HF, B0 是 一 个 需要 交叉 验证 选择 的 参数 。 在 这 种 方法 里 ，w。 按 比例 收缩 为 B/ | 工 ,, | ， 
因此 当 |Z, | >B 的 时 候 ， 调 整 几乎 没有 改变 。 同 样 ， 物 品 的 相似 性 收缩 为 
1 lu; | 
” lus 48 
如 文献 [4j 所 说 ，B 的 值 通常 为 100。 
4.3.2.4 关于 差异 的 说 明 
两 个 用 户 对 物品 给 出 一 致 的 喜欢 或 不 喜欢 评分 ， 可 能 会 不 如 他 们 给 出 差异 较 大 的 评分 
时 提供 更 多 的 信息 量 。 例 如 ， 多 数 人 都 喜欢 经 典 电影 “The Godfather”， 所 以 这 部 电影 的 
权重 通常 会 是 一 个 很 高 的 值 。 同 样 ， 一 个 用 户 对 于 物品 以 同样 方式 给 予 评分 所 提供 的 信 
息 ， 要 远 远 低 于 他 对 不 同 物品 体现 出 不 同 偏好 的 变化 所 显示 的 信息 。 
推荐 方法 解决 这 类 问题 是 使 用 反 用 户 频 率 (Inverse User Frequency)[10]。 基 于 信息 检 
索 领 域 反 文档 频率 (Inverse Document Frequency，IDF) 概 念 ， 每 个 物品 i 都 会 赋 以 权重 
4X:， 对 应 评论 了 物品 i 的 用 户 比 例 的 1og fH: 


w X Wuv (4. 26) 


w X wy (4. 27) 


lul 
| us | 

当 计算 用 户 wu 和 w 的 频率 加 权 皮 尔 逊 关联 系数 (Frequency-Weighted Pearson Correla- 
tion， FWPC)， 对 于 物品 i 的 评分 间 关 联 性 需要 给 予 权 重 4;: 


S ra = ty Cre; =F) 
iE Tuv 





Ai = log 


FWPC(u,v) = (4. 28) 


$juGs 一 元 )2 3G, 一元) 
3€ Tuv i€ Tuv 
这 种 方法 可 以 改进 基于 用 户 推荐 方法 的 预测 准确 性 [10]， 也 可 以 适用 于 物品 相似 性 
计算 。 
研究 人 员 还 提出 了 更 多 考虑 了 评分 差异 的 高 级 策略 。 文 献 [35] 描 述 了 其 中 一 种 方法 是 
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通过 最 大 化 用 户 之 间 平 均 相 似 性 来 计算 因子 4%;。 在 这 种 方法 中 ， 给 定 物品 的 权重 向 量 为 
A=Qis cns ADS AP u 和 w 之 间 的 相似 度 可 以 估算 为 用 户 与 用 户 v 有 着 相同 评分 的 可 
能 性 : 


Pr(u | vsA) = z exp( Ditata) 
v iE T, o 


其 中 Z, 是 一 个 标准 化 常量 ， 最 优 物品 权重 向 量 是 能 够 最 大 化 用 户 间 平均 相似 性 的 
那个 。 


4.3.3 近邻 的 选择 


近邻 数量 的 选择 和 选择 近邻 规则 对 于 推荐 系统 的 质量 会 产生 重要 影响 。 选 择 用 于 推荐 
系统 的 近邻 方法 通常 可 以 分 为 两 步 : 1) 用 全 局 过 滤 步 又 保持 最 有 可 能 的 近邻 2) 在 预测 每 
一 步 中 选择 最 合适 的 近邻 作 预 测 。 
4.3.3.1 过 滤 预 选 近邻 数 


在 大 型 的 推荐 系统 中 可 能 会 包含 几 百 万 条 用 户 和 物品 信息 ， 由 于 内 存 限制 ， 它 不 太 可 能 
存储 所 有 用 户 间 和 物品 间 的 非 零 相 似 度 。 这 样 做 也 是 极 大 浪费 ， 因 为 只 是 一 小 部 分 有 重要 影 
响 的 值 是 用 来 预测 的 。 预 选 近邻 数 是 一 项 基本 步 又， 它 通 过 减少 存储 相似 度 权重 数量 ， 并 且 
限制 用 于 预测 的 近邻 数目 ， 使 得 基于 近邻 推荐 方法 可 行 。 这 里 有 几 种 方法 可 以 实现 : 

。 Top-N 过 滤 : 对 于 每 一 个 用 户 或 者 物品 来 说 ， 列 表 中 仅仅 有 N 个 近邻 和 对 应 的 相 

似 度 权 重 是 需要 保留 的 。 为 了 防止 带 来 的 效率 和 准确 性 问题 ，N 的 选择 需要 比较 
谨慎 。 因 此 ， 当 N 选择 太 大 的 时 候 ， 需 要 大 量 的 内 存 来 存储 近邻 列表 ， 同 时 预测 
速度 也 会 变 得 很 慢 。 另 一 方面 ，N 选择 得 太 小 则 会 减 小 推荐 方法 的 覆盖 ， 这 样 会 
使 得 一 些 物 品 永远 推荐 不 出 来 。 

。 MATE: 与 选择 固定 数量 的 近邻 数目 不 同 ， 这 种 方法 保留 所 有 相似 度 权 重 数 大 
FARER BIB ww, 的 近邻 。 对 比 前 面 方法 ， 尽 管 这 种 方法 更 加 灵活 ， 因 为 仅 
仅 最 重要 的 近邻 会 被 保留 ， 但 同时 阀 值 wi 的 选择 也 是 比较 困难 的 。 

。 负 值 过 滤 : 通常 负 评 分 关联 比 正 关联 可 靠 性 要 差 。 显 而 易 见 地 ， 这 是 因为 两 个 用 
户 间 很 强 的 正 关联 性 预示 他 们 是 属于 同一 团体 的 (例如 ， 青 少年 、 科 幻 迷 等 )。 但 
是 ， 尽 管 负 关联 性 可 能 显示 其 属于 不 同 团体 ,但 它 不 能 显示 这 些 团 体 差异 程度 ， 
或 者 这 些 团 体 是 否 可 以 兼容 其 他 类 型 的 物品 。 一 些 实验 性 的 研究 L29，25] 发 现 负 
关联 性 对 预测 准确 性 没有 显著 的 提高 ， 根 据 数据 可 以 决定 是 否 需 要 丢弃 这 些 关联 
关系 。 

值得 注意 的 是 ， 这 三 种 过 滤 方 法 并 不 是 互 斥 的 ， 并 且 可 以 为 了 推荐 系统 的 需要 结合 在 一 
起 。 例 如 ， 可 以 在 丢弃 所 有 负 向 相似 度 的 同时 也 丢弃 那些 相似 度 比 给 定 阔 值 小 的 关联 关系 。 
4.3.3.2 用 于 预测 的 近邻 

一 旦 每 个 用 户 或 者 物品 的 候选 近邻 列表 被 计算 出 来 ， 对 一 个 新 的 评分 预测 可 以 通过 & 
近邻 方法 得 到 ，k 近邻 也 就 是 相似 权重 最 大 的 & 个 近邻 。 现 在 最 重要 的 问题 在 于 如 何 选择 
k 的 值 。 

表 4. 3 显示 ， 通 过 观察 所 得 的 预测 准确 度 随 着 & 值 的 增加 通常 呈现 为 一 个 止 的 函数 。 
因此 当 近 邻 数 目 限制 在 一 个 很 小 的 数 的 时 候 ( 如 &<20)， 预 测 精 度 通 常会 很 低 。 当 & 增加 
时 ， 越 来 越 多 的 近邻 参与 到 预测 中 ， 那 么 那些 由 单独 近邻 所 造成 的 偏差 就 会 被 平均 掉 。 这 
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样 的 结果 则 使 预测 精度 得 到 提高 。 最 后 ， 由 于 很 多 近邻 加 入 进来 进行 预测 ， 准 确 度 通常 会 
下 降 ( 如 A>50)， 这 样 原因 在 于 一 些 重要 的 关联 被 一 些 不 重要 的 关联 所 削弱 。 尽 管 在 一 些 
文献 中 ， 近 邻 数 目 大 概 在 20 一 50L28，25]， 但 最 优 的 & 值 依然 需要 通过 交叉 验证 来 实现 。 

最 后 请 注意 ， 基 于 少量 非常 相似 用 户 可 能 得 到 下 加 新 颖 的 推荐 结果 ， 但 代价 是 降低 准 
确 度 。 例 如 ， 推 荐 系统 可 以 找到 该 用 户 最 相似 的 用 户 ， 推 荐 的 新 物品 则 是 这 个 最 相似 用 户 
的 最 高 评分 物品 。 


4.4 高 级 进 阶 技术 


基于 近邻 的 方法 是 基于 评分 之 间 关 联 性 的 ， 如 前 面 所 提 及 的 一 些 方法 ， 这 类 方法 有 两 
个 重要 的 缺陷 : 
。 覆盖 受 限 : 由 于 计算 两 个 用 户 间 的 相似 性 是 基于 他 们 对 相同 物品 的 评分 ， 而 且 只 
有 对 相同 物品 进行 了 评分 的 用 户 可 以 作为 近邻 。 这 些 假 设 是 非常 受 限 制 的 ， 例 如 ， 
有 些 用 户 有 很 少 或 者 没有 共同 评分 但 依然 有 相似 的 爱好 。 而 且 ， 仅 仅 被 近邻 用 户 
评价 过 的 物品 才 会 被 推荐 ， 推 荐 方法 的 镍 盖 将 受到 限制 。 
。 XE ER AO SENE: 4. 2. 5 节 所 简单 提 到 的 另 一 个 评分 之 间 关 联 性 问题 就 是 ， 基 
于 近邻 推荐 方法 的 准确 性 会 受到 缺少 有 效 评分 限制 。 由 于 用 户 通常 只 是 对 一 小 部 
分 物品 进行 了 评分 [7，25，68，67]j， 稀 朴 性 是 大 多 数 推荐 系统 共同 问题 。 新 加 入 
系统 的 用 户 或 者 物品 根本 没有 评分 ， 也 就 是 所 谓 的 “ 冷 启动 ”问题 [69]， 所 以 这 种 
情况 下 ， 问 题 更 为 严重 。 当 数据 是 稀 朴 的 时 候 ， 两 个 用 户 或 物品 之 间 就 很 难 有 相 
问 的 评分 ， 这 就 造成 基于 近邻 方法 在 预测 评分 的 时 候 仅 使 用 了 很 少量 有 限 的 近邻 。 
另外 ， 相 似 性 权重 的 计算 也 可 能 依赖 小 部 分 的 评分 ， 从 而 导致 推荐 偏差 (此 类 问题 
可 以 查看 4. 3. 2. 3 节 )。 
解决 这 类 问题 一 个 常用 方法 就 是 用 默认 的 数据 去 填补 缺失 的 评分 [10，18]， 例 如 ， 评 
分 范围 的 中 值 ， 或 者 用 户 、 物 品 的 平均 评分 。 更 加 可 靠 的 方法 是 用 内 容 信息 去 填补 缺失 的 
评分 [16，25，41，50]。 人 例如， 缺失 评分 可 以 由 一 个 叫 filterbots 的 自动 组 件 提 供 [25， 
41]， 这 个 组 件 扮演 系统 中 普通 用 户 角色 ， 同 时 会 根据 物品 具体 内 容 的 特点 进行 评分 。 这 
些 缺 失 的 评分 也 可 以 通过 基于 内 容 方法 预测 的 评分 来 替代 [50]， 例 如 ，4, 1. 2. 1 节 所 描述 
的 方法 。 最 后 ， 内 容 相 似 性 也 可 以 在 系统 预测 中 用 来 代替 或 补充 评分 关联 相似 性 ， 找 到 预 
测 时 用 到 的 最 近邻 L7，46，59，72] 。 
上 述 提 到 方法 同样 具有 一 些 缺陷 。 例 如 ， 用 冉 认 数据 去 填补 缺失 数据 会 导致 推荐 的 一 
些 偏差 。 同 样 正如 4.1.2.1 节 所 提 到 的 ， 物 品 内 容 也 可 能 不 适 于 计算 评分 或 者 相似 性 。 本 
节 将 描述 两 种 解决 受 限 覆盖 或 者 稀疏 问题 的 方法 ， 降 维 方法 和 基于 图 (graph-based) 方 法 。 


4.4.1 降 维 方法 


降 维 方法 L[4，7，23，42，67，?74，75] 解 决 受 限 币 盖 和 数据 稀疏 性 问题 ， 是 通过 将 用 
户 或 者 物品 映射 到 隐 变 量 空 间 以 获取 它们 之 间 最 突出 的 特征 。 因 为 用 户 或 者 物品 之 间 的 对 
比 是 在 高 级 特征 的 密集 子 空间 内 ， 而 不 是 之 前 的 评分 空间 ， 这 样 更 多 有 意义 的 关联 就 能 够 
发 现 。 特 别 地 ， 即 使 用 户 所 评 的 物品 不 相同 ， 用 户 之 间 的 关联 也 能 够 被 发 现 。 并 且 这 类 方 
法 则 会 对 稀疏 数据 不 敏感 [4，7，67]。 主 要 有 两 种 降 维 方法 可 以 用 来 改善 推荐 系统 ; 1) 对 
基于 用 户 评分 矩阵 进行 分 解 ; 2) 对 稀 朴 的 相似 性 矩阵 进行 分 解 。 
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4. 4.1.1 对 评分 矩阵 进行 分 解 

隐 式 语义 索引 (Latent semantic indexing, LSI) 是 对 物品 推荐 的 降 维 的 一 种 流行 方法 
[15]。 在 这 种 方法 中 ， 一 个 |z|X17| 用 户 一 物品 评分 矩阵 R( 秩 为 n) 可 以 近似 表示 为 矩 
BER — PQ" GA k<n), Xr PEA |u| X 用户 因子 的 矩阵 ，Q 是 一 个 | 工 | X 物品 因 
FER. BUH, EE P KHR u fTCp, € R*) 表 示 用 户 映射 到 & 维 隐 空 间 的 坐标 。 同 样 
KH Q 的 第 ; ÍT ERORA MRS k 维 隐 空 间 的 坐标 。 和 矩阵 P 和 Q 通常 通过 最 小 
化 平方 Frobenius 范 数 定义 的 重建 误差 获取 : 

err(P,Q) = |R — PQ" |t = >) (ru — pq?” 


最 小 化 这 个 误差 等 同 于 求解 R 的 奇异 值 分 解 CSVD)[24] 
Re UDP 
其 中 矩阵 U 是 左 奇异 向 量 |z| Xm 和 矩阵， 矩阵 BSR Tl Xn, DEA 
异 向 量 的 nXn 对 角 和 矩阵 。 选 择 前 夺 个 最 大 奇异 值 及 对 应 的 奇异 向 量 和 矩阵 表示 为 OU, 


1/2 1/2 


V, ， 那 么 对 应 的 用 户 因子 矩阵 和 物品 因子 矩阵 可 以 表示 为 ;:P UL SQ VM. 

一 日 计算 得 到 矩阵 P 和 Q， 那么 基于 模型 的 评分 预测 7 为 

ra = Didi 

但 是 ， 使 用 SVD IERE R 会 带 来 一 个 严重 问题 : 矩阵 R 中 多 数 的 + 的 值 是 没 
有 定义 的 ， 因 为 用 户 w 可 能 没有 对 物品 i 评分。 尽管 可 以 像 前 面 提 到 的 那样 给 予 ru 缺 省 
值 ， 这 会 导致 数据 的 偏差 。 更 加 重要 的 是 这 样 做 会 使 得 大 矩阵 R 稠密 ， 并 且 使 SVD 分 解 
失效 。 对 于 这 类 问题 一 个 共同 的 做 法 就 是 在 学 习 和 矩阵 P 和 Q 的 时 候 仅仅 使 用 一 些 已 知 的 
评分 L4，42，73，75] : 


err(P,Q) = >) (re — pg? Y +aC pall? + all?) (4. 29) 
其 中 和 是 控制 正则 化 程度 的 参数 。 在 本 书 第 5 章 可 以 找到 有 关 这 种 推荐 方法 更 详细 的 


描述 。 
在 基于 近邻 推荐 方法 中 ， 也 可 以 用 这 种 方法 计算 在 隐 变 量 空间 中 用 户 或 者 物品 的 相似 
性 [7]。 通 过 解决 以 下 问题 来 完成 : 
err(P,Q)= >) (zs — paq?) 


/ s.t:|p.|=1,vuEu,lg|=1,viEerz (4. 30) 

其 中 zj 是 rw 对 进行 了 均值 中 心 化 后 使 其 范围 在 [一 1，1j]。 例 如 ， 如 果 ras 和 rmsx 分 别 
为 原始 评分 范围 的 最 小 值 和 最 大 值 ， 那 么 

问题 转化 成 ， 对 每 个 用 户 u 和 物品 i 而 言 ， 找 到 其 在 维 单元 球面 上 的 坐标 ,: MRE 
们 的 坐标 在 球面 上 距离 很 近 ， 用 户 x 就 会 为 物品 i 评 高 分 。 如 果 两 个 用 户 uw 和 w 在 球面 上 
越 接 近 ， 那 么 他 们 会 给 予 同一 物品 相似 的 评分 。 因 此 ， 用 户 之 间 的 相似 度 可 以 这 样 计算 : 

wu = pps 
同样 ， 两 个 物品 和 j 之 间 的 相似 也 可 以 这 样 计 算 获得 


Wu = 9:9) 
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4.4.1.2 对 相似 性 矩阵 进行 分 解 
第 二 种 降 维 方法 的 原则 和 前 面 提 到 方法 一 样 : 都 是 将 矩阵 分 解 为 因子 来 表示 用 户 或 者 物 
品 所 映射 到 的 隐 空 间 。 不 过 ， 这 里 分 解 的 是 一 个 稀 朴 的 相似 性 矩阵 而 不 是 评分 矩阵 。 设 克 
为 代表 用 户 或 物品 相似 度 的 秩 为 n 的 对 称 和 矩阵 。 为 了 简化 这 种 表示 ， 我 们 会 假设 和 前 面 例子 
一 样 ， 通 过 最 小 化 下 面 的 目标 函数 ， 用 更 低 秩 Ce BU RBPEW — PP" 来 近似 矩阵 W: 
err(P) = |R — PP" |} = 2; (wn — p,pi» 


JE MEW AL LIU ELE W 的 压缩 版 本 ， 相 比 W ORISA OBL. RUNI E B. HE 
Jae 已 可 以 等 同 于 计算 矩阵 W 的 特征 值 分 解 
W = VAV" 

其 中 A 是 包含 了 W All NTE EE, VEBE T IIN E E W |u lX 
lul WEZER. EV, 为 W Hk MERE HE C e A GE [6] ARDERE, E k 
维 的 隐 变 量子 空间 的 轴 。 和 矩阵 P=VA 的 第 行 表示 用 户 u 在 这 个 子 空间 中 的 坐标 p。E 

R*。 因 此 ， 用 户 在 隐 式 子 空间 中 的 相似 性 可 以 通过 以 下 矩阵 获得 
W' = PP! = V,A,VI (4. 31) 

这 种 方法 可 以 用 于 Eigentaste 系统 中 推荐 笑话 任务 [23]。 在 Eigentaste 系统 中 ， 将 包 
含 了 物品 对 之 间 皮 尔 逊 关联 相似 度 的 矩阵 W 进行 分 解 ， 可 以 得 到 由 W 的 两 个 主 特征 向 量 
定义 的 隐 式 子 空间 。 令 V, 表示 包含 这 些 特 征 向 量 的 矩阵 。 将 评分 矩阵 R 的 第 4 行 r。 所 代 
表 的 用 户 u 投影 到 V, 所 定义 的 平面 上 ， 得 

r,-— rV, 

在 离线 阶段 中 ， 可 以 通过 递归 细 分 的 技术 将 系统 中 的 用 户 在 平面 中 进行 聚 类 。 然 后 ， 
用 户 u 对 物品 ; 的 评分 可 以 通过 计算 和 用 户 u 同一 个 聚 类 中 的 所 有 用 户 对 物品 i 的 平均 评 
分 来 获得 。 


4.4.2 基于 图 方法 


基于 图 方法 是 将 数据 用 图 的 形式 表示 出 来 ， 在 图 中 用 户 、 物 品 或 者 两 者 都 可 以 用 点 的 
形式 表示 ， 边 表示 用 户 和 物品 之 间 的 交互 或 者 相似 性 。 例 如 ， 在 图 4.4 中 数据 可 以 建 模 成 


为 一 个 二 分 图 ， 其 中 两 个 节点 子 集 分 别 表示 用 户 和 TN 
物品 ， 连 接 用 户 u 到 物品 i 的 边 表示 用 户 w 对 物品 i ohn 4 
进行 了 评分 。 可 以 给 予 边 权重 表示 对 应 的 评分 情况 。 S fo pus 
在 其 他 一 些 模型 里 ， 节 点 集合 可 以 只 是 表示 成 用 户 ŽO Forrest Gump 
或 者 物品 ， 连 接 两 点 的 边 则 表示 对 应 这 些 节点 评分 OU ene 
有 充分 的 关联 ， 而 边 上 面 的 权重 则 表示 这 些 关联 Diane 
的 值 。 Titanic 

在 这 些 模 型 中 ， 传 统 的 方法 为 用 户 u 对 物品 i 图 4.4 用 一 个 二 分 图 表示 图 4.1 中 的 评 
评分 进行 预测 ， 仅 仅 会 使 用 到 这 些 有 直接 连接 的 用 分 (仅仅 列 出 集合 {2，3，4) 中 的 
户 u 或 者 物品 i 的 节点 。 基 于 图 方法 ， 则 从 另 一 方 iei 


面 出 发 ， 通 过 信息 传递 考虑 非 直接 连接 的 节点 间 的 影响 。 边 的 权重 越 大 ， 越 多 的 信息 可 以 
从 此 边 通 过 。 同 样 地 ， 如 果 在 图 中 距离 较 远 ， 那 么 一 个 节点 到 另 一 个 节点 影响 将 会 更 小 。 
这 两 个 性 质 就 是 熟知 的 传播 (propagation) 和 衰减 (attenuation)[26，34]， 常常 出 现在 基于 
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图 的 相似 性 计算 当中 。 

基于 图 方法 的 关联 传递 ， 可 以 通过 两 种 方式 来 推荐 物品 。 在 第 一 种 方法 中 ， 图 中 用 户 
u 对 物品 i 的 相近 距离 可 以 直接 用 于 评估 用 户 x 对 物品 i 的 评分 [19，26，34]。 通 过 这 种 
思想 ， 在 系统 中 为 用 户 推荐 物品 ， 可 以 通过 找到 用 户 u 在 图 中 最 近 的 物品 。 另 一 方面 ， 第 
二 种 方法 将 用 户 间或 者 物品 间 的 相近 距离 看 成 他 们 之 间 的 相似 度 权重 w,, 或 者 w; ， 然 后 使 
用 基于 近邻 的 推荐 方法 [19，48] 。 
4. 4.2.1 基于 路 径 的 相似 度 

在 基于 路 径 的 相似 度 计 算 中 ， 图 中 两 个 节点 间 的 距离 可 以 通过 计算 用 连接 两 个 节点 的 
路 径 数 目 和 这 些 路 径 长 度 所 构造 的 函数 来 获得 。 | 

最 短路 径 

文献 [2] 描 述 了 一 种 在 图 模型 中 通过 用 户 节 点 最 短 距 离 来 计算 他 们 之 间 相 似 性 的 推荐 
方法 。 在 这 种 方法 中 ， 数 据 可 以 建 模 成 为 一 个 以 用 户 为 节点 的 有 向 图 ， 他 们 之 间 的 边 是 基 
于 horting 和 可 预测 性 所 决定 的 。Horting 是 指 当 两 个 用 户 对 相同 物品 评分 时 才 会 满足 条 
件 的 一 种 非 对 称 关 系 。 用 公式 化 表示 ， 如 果 用 户 u horting AP v, WARI | Ti | >o R 
者 条 件 |Z., | /|Z | 8 之 一 需要 满足 ， 其 中 a、B 是 预定 义 的 阔 值 。 另 一 方面 ， 可 预见 性 
是 一 个 更 强 的 属性 ， 在 将 用 户 u MAP v 的 评分 刻度 间 的 差异 进行 转换 映射 后 ， 额 外 要 求 
用 户 u 的 评分 和 用 户 v 的 都 相似 。 因 此 ， FUP v 预测 用 户 “， 需 要 假定 用 户 horting 用 户 
v， 且 存在 一 个 线性 转换 : 1 : s~Ss， 这 样 才 满足 以 下 式 子 : 


和 二 一 于 ra — l(r4J|s 7 
zl ss 


Hp y d fg CES BU. 

可 预测 性 的 关系 在 图 中 表示 成 有 向 边 ， 如 边 从 ums 表示 v 预测 uw。 相应 地 ， 连 接 
用 户 u 和 用 户 v 的 有 向 路 径 表 示 ， 在 经 历 一 系列 转换 之 后 ， 用 户 ， 对 用 户 u 评分 的 传递 可 
预测 性 。 通 过 这 种 思想 ， 采 用 从 用 户 wu 到 其 他 对 新 物品 i 评分 用 户 的 最 短 有 向 路 径 ， 就 能 
预测 出 用 户 a 对 新 物品 i 的 评分 。 令 P=({(x，z ，w，…，wn)} 表 示 路 径 集合 ， 其 中 vo, € 
2i。 根 据 这 条 路 径 上 线性 映射 的 组 合 ， 可 以 将 用 户 vy 对 物品 i 的 评分 转换 到 用 户 的 评分 
刻度 上 : l 

pee? Ch ° 1, ) (ri) 

最 后 ， 预 测评 分 ~ ep. 中 的 ?的 平均 值 。 

路 径 数量 

在 二 分 图 中 用 户 与 物品 之 间 的 路 径 数量 可 以 用 来 评估 他 们 之 间 的 连通 性 [34]。 令 尺 表 

一 个 大 小 为 |u| X17| 的 评分 矩阵 ， 其 中 如 果 用 户 u 对 物品 进行 了 评分 rs 等 于 1， 否 
则 等 于 0。 二 分 图 的 邻接 和 矩阵 可 以 通过 尺 来 定义 : 
0 RT 
ee M 0 

在 这 种 方法 中 ， 用 户 wu 与 物品 i 之 间 的 关联 度 可 以 定义 为 用 户 w 到 用 户 v 的 所 有 不 同 
路 径 的 权重 之 和 (允许 每 个 节点 在 图 中 出 现 超过 一 次 )， 其 中 长 度 不 能 超过 给 出 的 最 大 长 度 
K。 由 于 图 是 二 分 图 ， 所 以 K 的 值 应 该 是 一 个 奇数 。 为 了 减弱 距离 较 长 路 径 的 贡献 度 ， 可 
以 给 出 一 个 关于 长 度 KK 的 权重 a*， 其 中 a€[0，1]。 由 于 A* 给 出 了 节点 对 之 间 长 度 为 k 
的 路 径 数 量 ， 那 么 用 户 一 物品 的 关联 矩阵 S, 可 以 这 样 表示 : 
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K 
Sk = Mo! A* = (I— eA)" (eA — aFA*) (4. 32) 


这 种 在 图 中 计算 节点 之 间距 离 的 方法 就 是 为 人 熟知 的 Katz 计算 方法 [38]。 这 种 方法 
与 冯 诺 依 曼 扩 散 (Von Neumann Diffusion) 核 方法 [20，40，43]: 


Kvp = > akA: = (I—acA)' (4. 33) 
k=0 
及 指数 扩散 (Exponential Diffusion) KA : 
Km = 23 gje'A* = exp(oA) (4. 34) 


紧密 关联 ， 其 中 A= 1, 

在 推荐 系统 中 包含 了 大 量 的 用 户 和 物品 ， 计 算 他 们 的 关联 值 需要 大 量 的 计算 资源 。 为 
了 克服 这 种 限制 ， 文献 [34] 中 使 用 了 扩散 激活 (spreading activation) 技 术 [14]。 本 质 上 ， 
这 类 技术 首先 激活 一 部 分 节点 子 集 作为 开始 节点 ， 然 后 迭代 地 激活 那些 和 已 经 激活 节点 直 
接连 接 的 节点 ， 直 到 达到 收敛 的 标准 。 
4.4.2.2 随机 游 走 相似 性 


在 基于 图 方法 里 的 传递 关联 也 可 以 通过 概率 框架 来 定义 。 在 这 个 框架 里 ， 用 户 或 者 物 
品 之 间 的 相似 性 可 以 估算 为 到 达 这 些 点 的 一 次 随机 漫步 概率 。 公 式 化 地 描述 为 一 个 一 阶 的 
马尔 可 夫 随 机 过 程 ， 其 定义 会 用 到 一 组 n 个 状态 ， 以 及 一 个 nXn 的 转移 概率 矩阵 已 ， 其 
中 在 任意 时 段 : 从 状态 i 跳 转 到 状态 j 的 概率 是 

py = Pr(s(t+1)=j| s(t) = i) 

定义 向 量 w(t) 为 包含 了 步骤 i 的 状态 概率 分 布 ， 因 此 xi(t)= 二 Pr(s(t) 二 i)。 马 尔 可 夫 链 

过 程 可 以 这 样 表示 : 
x(t++1)= P'x(t) 
因此 ， 如 果 P 的 行 是 随机 的 ( 即 对 于 所 有 i,，2)p; — 1 )， 这 个 过 程 收 敛 于 一 个 稳定 的 


分 布 向 量 x(co)， 这 向 量 对 应 于 P 中 特征 值 为 1 的 特征 向 量 。 这 个 过 程 通常 可 以 用 每 个 
节点 对 应 一 个 状态 的 有 权 图 来 描述 ， 其 中 一 个 节点 到 另 一 个 节点 的 跳 转 概率 则 是 由 连接 两 
点 的 边 的 权重 给 出 的 。 

ltemRank 算法 

ItemRank[26 1] 方法 是 基于 PageRank 算法 [11]( 对 Web 网 页 进行 排行 的 算法 ) 的 一 种 
推荐 方法 。 这 种 方法 基于 用 户 在 图 中 随机 游 走 访问 到 物品 i 的 概率 ， 对 用 户 u 对 新 物品 i 
的 喜爱 程度 进行 排序 ， 其 中 图 的 节点 表示 评分 物品 ， 有 相同 用 户 评分 的 节点 间 用 边 相 连 。 
边 的 权重 通过 一 个 |T| X |1Z| 的 转换 概率 矩阵 给 出 ， 其 中 p; = |uj |/1ui | 表示 当 用 户 已 经 
对 物品 i 评分 后 还 会 对 物品 ;7 评分 的 预 估 条 件 概率 。 

在 PageRank 算法 中 ， 对 于 任意 一 步 t 的 随机 游 走 ， 既 可 以 通过 PP 以 固定 的 概率 a B 
转 到 邻近 节点 ， 也 可 以 (1 一 a) 的 概率 “ 瞬 移 ”到 任意 节点 。 令 r, 表示 评分 矩阵 R MS u 行 ， 
FAP 久 瞬 移 到 其 他 节点 的 概率 分 布 函数 可 以 通过 向 量 d,==r, /lr,| 给 出 。 通 过 上 面 的 定义 ， 
用 户 u ER t+] 步 状 态 概率 分 布 向 量 可 以 这 样 表示 : 

z, C 4-1) = eP'x,(t) + (1— 00d, (4. 35) 


在 实际 应 用 中 ， 通 常 这 样 计算 r, Coo 首先 使 用 均匀 分 布 初始 化 ， 如 aO, 
然后 使 用 式 (4. 35) 更 新 rx,， 直 到 其 收 剑 。 一 旦 计算 获得 x, (co)， 系 统 就 会 向 用 户 江 推荐 
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na ARAN Ri. 

平均 首次 通过 /往返 次 数 

针对 推荐 问题 还 有 其 他 基于 随机 游 走 的 距离 测量 方法 。 其 中 包括 平均 首次 通过 次 数 和 
平均 往返 次 数 [19，20]。 平 均 首次 通过 次 数 (average first-passage time) m(j |i) [56 E45 24 
开始 节点 iz; 时 ， 第 一 次 到 达 节 点 ; 所 需要 平均 随机 游 走 步 数 。 令 P 表示 为 一 个 nXn 的 
概率 转换 和 矩阵， 那么 mCG |i) 可 以 这 样 计算 获得 


m(j |i) = = . 
1+ S)pamG lk), 其 他 
k=] 


平均 首次 通过 次 数 方法 的 一 个 问题 是 它 不 对 称 ， 一 个 相关 的 解决 方法 是 平均 往返 次 数 C 


(average commute time), n(i, j)=m(j |i) +m(ilj)[22], KRAF T 5 à i5; 第 一 次 
到 达 节 点 7 并 且 返 回 到 i 的 平均 随机 游 走 步 数 。 这 种 计算 方法 有 几 个 有 意思 的 性 质 ， 也 就 
是 说 ， 这 是 某 种 欧 几 里 得 空间 中 的 真实 距离 L22]， 这 个 性 质 和 电力 网 络 中 电阻 性 质 以 及 
Laplacian 矩阵 图 中 的 伪 逆 性 质 接近 [19]。 

在 文献 L19] 中 ， 平 均 往 返 次 数 用 来 计算 推荐 系统 中 代表 了 用 户 和 物品 间 相 互 作用 的 二 
分 图 里 的 节点 之 间 的 距离 。 对 于 每 一 个 用 户 wu 到 任意 一 个 物品 i€ET 的 有 向 边 的 权重 可 以 
简单 表示 为 1/ 1, | 。 同 样 地 ， 对 于 每 一 个 物品 i 到 任意 一 个 物品 Eu; 的 有 向 边 ， 其 权重 
为 1/ |u|。 平均 往返 次 数 可 以 用 在 两 个 不 同 地 方 : 1) 依 据 nu, 站 的 极 小 值 为 用 户 u 推荐 
物品 i; 2) 根 据 往 返 次 数 的 距离 ， 寻 找 用 户 u 的 近邻 用 户 ， 然 后 为 用 户 u 推荐 这 些 用 户 喜 
好 的 物品 。 


4. 5 总 结 


基于 近邻 推荐 方法 是 物品 推荐 任务 中 最 早 使 用 的 方法 之 一 ， 现 在 依然 有 着 相当 广泛 的 
应 用 。 尽 管 这 种 方法 可 以 简单 地 描述 和 实现 ， 但 它 有 着 几 个 重要 的 优势 : 它 可 以 解释 一 个 
推荐 任务 为 什么 使 用 列表 中 的 这 些 近 邻 ， 其 计算 和 空间 的 效率 使 其 可 扩展 到 大 的 推荐 系统 
中 ， 线 上 加 入 新 的 用 户 或 者 物品 能 够 保持 稳定 性 。 这 种 方法 另外 一 个 重要 优势 是 使 得 推荐 
拥有 新 颖 性 ， 使 得 用 户 可 以 发 现 没 有 期 望 得 到 但 却 是 感 兴趣 的 物品 。 

实现 基于 近邻 推荐 方法 的 时 候 ， 需 要 做 几 个 重要 决策 。 如 选择 基于 用 户 或 者 选择 基 
于 物品 推荐 方法 会 很 大 程度 上 影响 推荐 系统 的 准确 性 和 效率 。 在 传统 的 商业 推荐 系统 
中 ， 用 户 的 数量 要 远 远大 于 物品 的 有 效 数 量 ， 选 择 基 于 物品 方法 会 更 加 适合 ， 因 为 它们 
可 以 提供 更 加 准确 的 推荐 ， 同 时 计算 效率 更 高 且 很 少 需要 频繁 的 更 新 。 另 一 方面 ， 基 于 
用 户 推荐 方法 通常 可 以 给 出 更 加 独到 的 推荐 ， 这 种 方法 会 使 得 用 户 更 加 满意 。 另 外 ， 基 
于 近邻 方法 的 不 同 组 成 部 分 ， 如 评分 标准 化 、 相 似 性 权重 的 计算 、 近 邻 的 选择 ， 都 会 对 
推荐 系统 的 质量 产生 重要 的 影响 。 对 于 每 一 个 组 成 部 分 ， 都 有 几 种 不 同 的 方法 可 供 选 
择 ， 尽 管 每 种 方法 的 优点 中 在 文献 中 描述 了 ， 但 是 需要 注意 的 是 ， 在 不 同 的 系统 中 ， 最 
适合 的 方法 也 是 不 相同 的 ， 因 此 ， 从 实际 的 系统 和 应 用 的 需要 出 发 才能 对 这 些 算 法 做 出 
最 有 效 的 评价 。 

最 后 ， 当 基于 近邻 方法 的 效果 受到 受 限 覆 盖 和 数据 稀 朴 性 问题 影响 的 时 候 ， 可 以 尝试 
基于 降 维 和 基于 图 的 方法 。 降 维 方法 可 以 提供 用 户 和 物品 的 一 个 压缩 表示 ， 这 样 就 可 以 获 
取 他 们 最 重要 的 特征 。 这 类 方法 的 一 个 重要 优点 在 于 ， 即 使 用 户 对 不 同 物品 进行 了 评分 或 


96 第 一 部 分 基础 技术 


物品 被 不 同 的 用 户 所 评分 ， 仍 可 以 获取 用 户 间 或 者 物品 间 的 有 效 关联 。 另 一 方面 ， 基 于 图 
模型 方法 是 挖掘 数据 之 间 的 传递 关系 。 这 种 技术 可 以 通过 计算 用 户 之 间或 者 物品 之 间 非 直 
接 的 关联 来 有 效 避 免 煞 据 稀 朴 和 覆盖 受 限 问题 。 同 时 ， 与 降 维 方法 不 同 的 是 ， 基 于 图 方法 
可 以 保留 数据 之 间 的 一 些 “ 局 部 关联， 从 而 可 以 提供 新 颖 的 推荐 。 
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Yehuda Koren 和 Robert Bell 


摘要 ”推荐 系统 的 协同 过 滤 算 法 已 经 得 到 了 人 们 的 普遍 关注 并 取得 了 很 大 的 进展 。 协 
同 过 滤 算 法 在 近期 结束 的 Netflix 推荐 系统 比赛 中 起 到 的 核心 作用 无 疑 又 增加 了 它 的 知名 
度 。 本 章 展 示 了 协同 过 滤 算 法 领域 的 新 进展 。 和 矩阵 因子 分 解 技 术 已 经 成 为 实现 协同 过 滤 算 
法 的 首选 ， 本 章 描述 了 该 技术 及 其 最 新 改进 。 此 外 ， 本 章 也 描述 了 协同 过 滤 领 域 曾经 处 于 
统治 地 位 的 基于 邻 域 的 算法 的 一 些 扩展 ， 这 些 扩展 提高 了 这 些 传 统 算法 的 准确 性 ， 使 得 它 
们 更 具 竞争 力 。 本 章 阑 述 了 如 何 利用 时 态 模型 和 隐 反 馈 来 提升 模型 的 准确 性 。 另 外 ， 本 章 
对 参赛 者 为 解决 Netflix Prize 推荐 系统 比赛 的 挑战 而 提出 的 一 些 主要 的 推荐 算法 给 出 了 详 
细 的 阐述 。 


5.1 简介 


协同 过 滤 (CF) 方 法 基于 用 户 对 商品 的 评分 或 其 他 行为 (如 购买 ) 模 式 来 为 用 户 提供 个 
性 化 的 推荐 ， 而 不 需要 了 解 用 户 或 者 商品 的 大 量 信息 。 尽 管 目前 已 经 成 形 的 方法 在 很 多 应 
用 上 都 工作 得 很 好 ， 我 们 依然 提出 了 一 些 最 近 提 出 的 对 该 领域 已 有 方法 的 拓展 ， 则 在 为 正 
在 寻找 最 有 可 能 成 功 的 推荐 的 分 析 员 提供 一 些 帮 助 。 | 

Netflix Prize 比赛 于 2006 年 开始 举行 ， 该 比赛 对 协同 过 滤 领 域 的 发 展 起 到 了 重要 的 推 
动作 用 。 科 研 界 第 一 次 获得 了 大 规模 的 工业 界 数 据 ( 数 以 亿 计 的 电影 评分 )， 这 吸引 了 数 以 
千 计 的 科学 家 、 学 生 、 工 程 师 以 及 推荐 系统 的 狂热 者 进入 协同 过 滤 研 究 领域 。 比 赛 的 性 质 
使 得 该 领域 迅速 发 展 ， 新 技术 层出不穷 ， 而 且 每 一 次 技术 的 变革 都 旨 在 提高 预测 准确 度 。 
由 于 所 有 的 方法 都 在 相同 的 数据 上 经 同样 的 严格 标准 来 评判 ， 演 进而 来 的 模型 功能 更 强 
大 、 更 高 效 。 

推荐 系统 的 性 能 依赖 于 输入 的 不 同类 型 。 最 高 效 的 输入 是 用 户 高 质量 的 显 式 反馈 ， 也 就 是 
用 户 直接 说 出 他 们 对 哪些 产品 感 兴趣 。 例 如 ，Netflix 通过 让 用 户 单 击 “ 跷 拇指 ?或 “下 拇指 ”来 搜 
集 电 影 的 星 级 评价 。 同 样 ，TiVo 用 户 也 用 这 一 方式 来 表明 他 们 对 电视 节目 的 喜好 。 

由 于 显 式 反馈 并 不 经 常 可 用 ， 一 些 推荐 系统 从 比较 丰富 的 隐 式 反馈 中 来 推断 用 户 的 爱 
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好 ， 也 就 是 通过 观察 用 户 的 行为 来 间接 得 到 用 户 的 喜好 [22]。 隐 式 反馈 的 类 型 包括 用 户 的 
购买 记录 、 浏 览 历史 记录 、 搜 索 模 式 ， 甚 至 是 鼠标 的 移动 。 例 如 ， 如 果 一 个 人 购买 了 同一 
个 作者 的 许多 书 则 可 以 说 明 这 个 人 很 喜欢 该 作者 。 本 章 重 点 关注 与 显 式 反馈 相 匹配 的 模 
型 。 尽 管 如 此 ， 我 们 也 意识 到 隐 式 反馈 的 重要 性 。 当 用 户 没 有 提供 显 式 反馈 的 时 候 ， 隐 式 
反馈 就 显得 弥 足 珍贵 了 。 因 此 ， 我 们 也 会 展示 如 何在 模型 中 把 隐 式 反馈 当 作 辅 助 信 息 来 
处 理 。 

为 了 建立 推荐 信息 ，CF 系统 需要 把 两 种 有 本 质 区 别 的 实体 联系 起 来 ， 即 物品 和 用 户 。 
有 两 种 主要 的 方法 来 方便 比较 这 两 种 实体 ， 构 成 了 CF 的 两 种 主要 技术 : 基于 邻 域 的 方法 
和 隐语 义 模型 。 基 于 邻 域 的 方法 重点 关注 物品 之 间 的 关系 或 者 用 户 之 间 的 关系 。 基 于 物品 
的 方法 是 根据 某 用 户 对 和 他 感 兴趣 的 物品 相似 的 物品 的 评分 ， 来 对 该 用 户 对 这 件 物品 的 偏 
好 建立 模型 。 隐 语义 模型 ， 如 和 矩阵 因子 分 解 模型 ， 采 用 的 是 另 一 种 方法 ， 即 把 物品 与 用 户 
映射 到 相同 的 隐语 义 空间 的 方法 。 隐 语义 空间 试图 通过 描述 产品 和 用 户 两 种 实体 在 因子 上 
的 特征 来 解释 评分 ， 而 这 些 因子 是 根据 用 户 的 反馈 自动 推断 出 来 的 。 

产生 具有 更 精确 预测 结果 的 方法 需要 深化 基础 和 减少 对 任意 决策 的 依赖 。 本 章 阑 述 了 
一 系列 近期 提出 的 基本 CF 建 模 技术 的 改进 。 然 而 ， 要 想 追 求 更 加 精确 的 模型 不 能 满足 和 
局 限于 这 些 改进 。 同 等 重要 的 是 对 数据 中 所 有 可 用 的 信号 或 者 特征 的 识别 。 传 统 的 技术 解 
决 了 用 户 一 物品 评分 数据 中 的 稀 朴 问题 。 利 用 其 他 的 信息 可 以 显著 提高 精确 性 。 一 个 典型 
的 案例 是 考虑 各 种 时 间 效 应 信息 ， 这 些 时 间 效 应 信息 反映 了 用 户 一 物品 交互 的 、 动 态 的 时 
间 漂 移 特 性 。 相 对 不 那么 重要 的 是 监听 用 户 的 隐 式 反馈 ， 如 用 户 对 哪些 产品 来 评分 (不 管 
评分 分 数 )。 被 评分 的 物品 不 是 随机 选择 的 ， 而 是 揭示 了 用 户 感 兴趣 的 方面 ， 而 这 些 信息 
比 评分 的 数值 更 加 重要 。 

5. 3 节 阐 述 了 矩阵 因子 分 解 的 一 些 技术 ， 这些 技术 综合 考虑 了 算法 实现 的 便利 性 和 相 
对 高 的 预测 准确 度 。 这 也 使 得 这 些 技术 成 为 了 解决 最 大 的 公开 数据 集 一 一 Netflix 数据 的 
推荐 问题 的 最 佳 算法 。 这 一 节 描 述 了 这 些 技术 背后 的 理论 和 实用 细节 。 除 此 之 外 ， 和 矩阵 因 
子 分 解 模型 的 优势 的 大 部 分 源 于 它们 处 理 数据 的 额外 特征 的 能 力 ， 这 些 额 外 特征 包括 隐 式 
反馈 和 时 序 信息 。 本 节 描 述 了 如 何 增强 矩阵 分 解 模型 来 处 理 这 些 额 外 特征 。 

5.4 节 讨论 了 基于 邻 域 的 方法 。 这 个 流派 中 的 基本 方法 是 众所周知 的 ， 而 且 在 很 大 程 
度 上 是 基于 启发 式 方法 的 。 近 期 提出 的 一 些 技 术 提 议 使 用 更 加 严格 的 公式 来 克服 基于 邻 域 
的 方法 的 缺点 ， 因 此 提高 了 预测 准确 度 。5. 5 节 阅 述 了 一 种 更 高 级 的 方法 ， 这 个 方法 基于 
普通 基于 邻 域 的 方法 的 原理 ， 并 使 用 了 因 式 分 解 模型 的 典型 技术 一 一 全 局 优化 技术 。 这 个 
方法 允许 放宽 对 邻 域 大 小 的 限制 ， 同 时 考虑 了 隐 式 反馈 和 时 间 效 应 信息 。 该 方法 预测 结果 
的 精度 接近 矩阵 因子 分 解 模型 ， 同 时 与 矩阵 因子 分 解 模型 相 比 具有 一 些 实用 的 优势 。 

当 从 最 根本 上 考虑 这 些 模 型 时 ， 我 们 就 会 发 现 那些 看 似 无 关 的 技术 之 间 竟 然 存在 着 惊 
人 的 联系 。 我 们 将 会 在 5. 6 节 通 过 证 明基 于 物品 和 基于 用 户 这 两 种 基于 邻 域 的 模型 或 许 会 
在 同一 个 模型 中 同时 出 现 来 详细 说 明 这 一 点 。 而 且 在 那个 模型 中 ， 这 两 种 模型 都 等 价 于 甜 
阵 因 子 分 解 模型 。 这 些 关联 削弱 了 之 前 分 类 方法 的 相关 性 。 比 如 ， 我 们 传统 上 把 矩阵 因子 
分 解 模 型 广义 分 类 为 “基于 模型 的 ”， 而 把 基于 邻 域 的 模型 广义 分 类 为 “基于 记忆 的 ”。 


5.2 预备 知识 


现在 对 m 个 用 户 ( 也 就 是 消费 者 ) 和 个 物品 (也 就 是 产品 ) 进 行 评分 。 为 了 区 别 用 户 和 
物品 ， 我 们 用 特殊 的 索引 字母 来 具体 指 代 二 者 : Alu, o AKAP, i j, 代表 物品 。 评 
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分 rs 代表 用 户 对 物品 i 的 偏好 程度 ， 值 越 大 代表 用 户 对 物品 越 感 兴趣 。 例 如 ， 评 分 值 可 
以 为 取 值 范围 为 1( 表 示 不 感 兴趣 ) 到 5( 表 示 很 感 兴 趣 ) 的 整数 。 我 们 用 六 来 表示 预测 的 偏 
好 程度 ， 用 以 和 真实 值 ;区别 。 

数值 i 表示 评分 7, 的 发 生 时 间 。 该 时 间 的 单位 随 着 当前 应 用 的 情况 而 变化 。 例 如 ， 
车 以 天 为 单位 ，ts 记 录 了 从 早期 某 一 时 间 点 到 现在 的 天 数 。 通 常 绝 大 部 分 的 评分 是 未 知 
的 。 例 如 ， 在 Netflix 数据 中 99% 的 可 能 评分 是 缺失 的 ， 因 为 用 户 一 般 只 会 给 予 一 小 部 分 
电影 评分 。 评 分 值 ri 已 知 的 (uw， 站 对 存放 在 集合 K 二 {(u，v) : rs 已 知 }。 每 一 个 用 户 u5 
表示 为 RCw) 的 一 个 物品 集合 相关 联 ， 该 集合 包含 了 用 户 u 给 予 评 分 的 所 有 物品 列表 。 与 
之 相似 的 是 ，R() 定 义 了 评分 了 的 物品 i 的 所 有 用 户 的 列表 。 有 时 ， 定 义 集合 NWA 
P wu 提供 了 隐 式 偏好 信息 的 物品 (如 用 户 租 用 过 、 购 买 过 或 浏览 过 的 物品 ) 列 表 。 

由 评分 数据 建立 的 模型 通过 拟 合 已 经 观测 到 的 评分 记录 来 进行 学 习 。 然 而 ， 我 们 的 目 
标 是 以 一 种 能 预测 未 来 未 知 的 评分 的 方式 来 一 般 化 这 些 已 经 观测 到 的 结果 。 因 此 ,我 们 应 
当 小 心 道 慎 预 防 过 拟 合 观 测 数 据 。 我 们 通过 正则 化 学 习 参 数 来 避免 过 拟 合 现象 ， 即 对 这 些 
参数 的 复杂 度 增加 惩罚 系数 。 正 则 化 由 AL. AS 等 常量 参数 来 控制 。 这 些 常量 通过 交叉 验证 
来 决定 。 随 着 它们 的 增长 ， 正 则 化 任务 变 得 越 来 越 繁 重 。 


5.2.1 基准 预测 


CF 模型 试图 捕捉 用 户 和 物品 之 间 的 交互 作用 ， 正 是 这 些 交 互 作用 产生 了 不 同 的 评分 
值 。 然 而 ， 大 部 分 观察 到 的 评分 值 要 么 与 用 户 相关 ， 要 么 与 物品 相关 ， 而 与 用 户 和 物品 之 
间 的 交互 作用 无 关 。 比 如 ， 典 型 的 CF 数据 显示 了 用 户 和 物品 中 存在 的 偏 置 ， 也 就 是 说 ， 
数据 中 有 某 些 用 户 评分 比 其 他 用 户 高 和 某 些 物品 得 到 的 评分 比 其 他 物品 高 的 明显 倾向 。 

我 们 将 把 这 些 与 用 户 一 物品 交互 作用 无 关 的 因子 (这 些 因 子 也 叫 偏 置 ) 封 装 到 基准 预测 
中 。 由 于 这 些 基 准 预 测 值 在 观察 到 的 评分 中 占 很 大 比例 ， 所 以 对 它们 进行 准确 的 建 模 就 显 
得 至 关 重 要 了 。 这 样 的 建 模 方法 把 真正 代表 用 户 一 物品 之 间 交 互 作 用 的 那 部 分 数据 隔离 开 
来 ， 而 把 这 部 分 数据 放 到 更 合适 的 用 户 偏 好 模型 中 。 

Wt w 为 总 体 平 均 评 分 。 未 知 评分 ri 的 基准 预测 5 综合 考虑 了 用 户 和 物品 两 个 因子 : 

bs = p+ b, + bi (5.1) 

参数 Mb 分 别 表示 用 户 w 和 物品 i 的 与 评分 平均 值 的 偏差 。 例 如 ， 假 设 我 们 想 建 
立 一 个 用 户 Joe 对 Titanic 电影 的 评分 的 基准 预测 。 假 设 所 有 电影 的 平均 评分 为 3.7 星 。 
另外 ，Titanic 比 一 般 的 电影 要 好 ， 因 此 其 评分 要 比 平均 评分 高 0.5 星 。 另 外 ，Joe 是 一 个 
爱 挑剔 的 用 户 ， 他 的 评分 一 般 要 比 平均 评分 低 0.3 星 。 因 此 ，Joe 对 Titanic 评分 的 基准 预 
测 为 3. 7 一 0. 3 十 0. 5 三 3.9。 我 们 可 以 通过 解决 最 小 二 乘法 问题 来 估计 入 0 5; 的 值 ， 如 下 
面 公式 所 示 : 

min >) (ru — 4 — b, hY E (36i 91) 


* (DEK 


在 这 个 公式 中 ， 第 一 项 _ >， (ri 一 /十 b 十 6;)? 用 来 寻找 与 已 知 评分 数据 拟 合 得 最 好 的 


(Dex 


b, Mbio EWEN à ( X70} + 2j) 通过 对 参数 的 复杂 性 增加 惩罚 因子 来 避免 过 拟 合 现 


象 。 这 个 最 小 二 乘 问题 可 以 通过 在 5. 3. 1 节 描述 的 随机 梯度 下 降 算法 有 效 地 解决 。 
Netflix 电影 评分 数据 的 平均 评分 Cy) 为 3. 6。 已 知 评分 数据 中 用 户 偏 置 (六 ) 的 均值 为 
0. 044， 标 准 差 为 0.41。 用 户 偏 置 (16, | ) 的 绝对 值 的 均值 为 0.32。 学 习 数 据 中 物品 偏 置 6 
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的 均值 为 (6;) 一 0. 26， 标 准 差 为 0. 48。 物 品 偏 置 (|6; |) 的 绝对 值 的 均值 为 0. 43. 
一 种 简单 但 是 准确 度 不 高 的 估计 参数 的 方法 是 把 o. 的 计算 和 6 的 计算 分 离开 来 。 首 
先 ， 对 每 一 个 物品 i, S 


Az HIRO 

对 每 一 个 用 户 xu, 令 

>» (ra — nu — b) 
As [|RG0| 

iE FE WEE CAL. As, RATA UAE ER DBE, SRA, As 由 交叉 
验证 决定 。Netflix 数据 集 上 通常 取 2a; —25, A, —10, 

在 5. 3.3.1 节 ， 我 们 将 会 证 明 如 何 通过 考虑 数据 内 部 的 时 间 效 应 信息 来 提高 基准 预测 
的 准确 度 。 


5.2.2 Netflix 数据 


为 了 比较 本 章 描 述 的 算法 的 相对 准确 性 ， 我 们 在 Netflix 数据 上 对 这 些 算 法 进行 了 评 
4h, Netflix 数据 是 由 匿名 Netflix 客户 从 1999 年 11 月 到 2005 年 12 月 做 出 的 具有 邮戳 日 
期 的 上 亿 条 电影 评分 [5]。 评 分 数据 是 从 1 到 5 的 整数 。 数 据 由 超过 480 000 用 户 对 17 770 
部 电影 的 评分 构成 。 因 此 ， 平 均一 部 电影 会 得 到 5600 个 评分 ， 而 一 个 用 户 会 对 208 部 电影 
进行 评分 ， 当 然 这 些 均值 会 有 很 大 的 方差 。 考 虑 到 与 其 他 方法 公布 的 结果 的 兼容 性 ， 我 们 采 
用 由 Netflix 设 定 的 标准 。 首 先 ， 结 果 的 质量 通常 由 均 方 根 误差 (RMSE) 来 度量 : 
Gu — £4)! / | TestSet | 


(uD € TestSet 

跟 另 一 种 度量 方法 (平均 绝对 误差 ) 相 比 ， 这 个 度量 更 关注 大 误差 。( 人 参考 第 8 章 里 面 
关于 推荐 系统 评价 标准 的 综述 。) 

我 们 在 Netflix 提供 的 测试 集 ( 也 叫 问答 集 ) 上 来 报告 预测 结果 ， 这 个 测试 集 包 含 了 近 
期 140 万 条 评分 记录 。 与 训练 集 数 据 相 比 ， 测 试 集 数据 包含 了 更 多 的 那些 不 经 常 对 电影 评 
分 的 用 户 的 评分 记录 ， 因 此 这 些 用 户 的 评分 行为 也 就 更 难 预 测 。 在 某 种 程度 上 ， 这 种 情况 
代表 了 CF 系统 的 真实 需求 ， 即 需要 从 旧 的 评分 中 得 到 新 的 评分 以 及 需要 均衡 地 覆盖 所 有 
用 户 ， 而 不 只 是 经 常 做 评分 的 那些 。 

Netflix 数据 是 Netflix Prize 比赛 的 一 部 分 ， 这 个 比赛 的 基准 平台 是 Netflix 的 私有 系 
统一 一 Clibemactch， 该 系统 在 测试 集 上 得 到 的 RMSE 为 0.9514。 大 奖 将 会 颁 给 经 过 三 年 
努力 把 RMSE 降低 到 0. 8563( 在 原 有 的 基础 上 提高 10%) 以 下 的 团队 。 测 试 集 上 可 得 到 的 
RMSE 值 可 提升 空间 非常 小 ， 因 此 很 明显 要 想得到 这 个 大 奖 非常 困难 。 但 是 ， 证据 显示 
RMSE 值 的 小 幅度 提升 将 会 对 top-k 推荐 的 质量 产生 很 大 的 影响 L17，19] 。 








5.2.3 隐 式 反馈 


本 章 集中 讨论 了 显 式 的 用 户 反馈 。 但 是 ， 如 果 有 额外 的 隐 式 反馈 信息 可 用 ， 这 些 信息 
可 用 来 更 好 地 探索 用 户 的 行为 。 这 在 解决 数据 的 稀 玻 问题 以 及 当 用 户 的 显 式 反馈 很 少时 显 
得 非常 有 用 。 我 们 将 阐述 之 前 讨论 的 模型 的 一 些 拓 展 ， 这 些 拓 展 利 用 了 隐 式 反馈 信息 。 

对 于 像 Netflix 这 样 的 数据 集 来 说 ， 得 到 隐 式 反馈 信息 的 最 自然 的 方式 是 电影 的 租借 
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历史 记录 。 这 个 历史 记录 告诉 我 们 用 户 的 爱好 而 不 需要 让 他 们 显 式 地 提供 他 们 的 评分 。 对 
于 其 他 的 数据 集 ， 浏 览 历 史记 录 或 购买 历史 记录 可 以 作为 隐 式 反馈 信息 。 但 是 这 些 数 据 并 
不 提供 给 我 们 来 做 实验 。 尽 管 如 此 ， 在 Netflix 数据 集中 还 存在 着 一 种 比较 隐 噬 的 用 户 隐 
式 信息 。 这 个 数据 集 不 仅 告 诉 我 们 评分 值 ， 还 包括 用 户 对 哪些 电影 进行 了 评分 ， 不 论 他 们 
如 何 进行 评分 。 也 就 是 说 ， 如 果 一 个 用 户 选 择 一 部 电影 并 打分 ， 那 么 她 就 隐 式 地 告知 了 我 
们 她 的 兴趣 。 于 是 可 以 建立 一 个 二 元 矩阵 ， 其 中 1 代表 已 评分 ，0 代表 未 评分 。 尽 管 这 些 
二 元 数据 并 没有 包含 像 其 他 表示 隐 式 反馈 的 独立 信息 源 那 样 多 的 信息 ， 但 是 整合 这 些 隐 式 
的 二 元 数据 也 会 大 大 提高 预测 的 准确 度 。 使 用 这 个 二 元 数据 能 使 预测 模型 受益 与 一 个 事实 
密 不 可 分 ， 这 个 事实 就 是 用 户 的 评分 记录 并 不 是 随机 缺失 的 ， 用 户 会 小 心 着 慎 地 选择 他 们 
要 进行 评分 的 物品 (参见 Marlin 等 [21]) 。 


5.3 因子 分 解 模型 


用 隐语 义 模型 来 进行 协同 过 滤 的 目标 是 揭示 隐藏 的 特征 ， 这 些 隐 藏 的 特征 能 够 解释 观 
测 到 的 评分 。 该 模型 的 一 些 实例 包括 pLSA 模型 [15]、 神 经 网 络 模型 [24]、 隐 式 Dirichlet 
分 配 模型 [7]， 以 及 由 用 户 一 物品 评分 矩阵 的 因子 分 解 推导 出 的 模型 (也 叫 作 基于 SVD 的 
模型 )。 最 近 ， 和 矩阵 因子 分 解 模型 由 于 其 准确 性 和 稳定 性 得 到 越 来 越 多 人 的 青睐 。 

在 信息 检索 领域 ，SVD 是 为 了 识别 隐语 义 变量 [9] 而 发 展 起 来 的 。 然 而 ， 由 于 大 部 分 
评分 值 的 缺失 ， 把 SVD 应 用 到 CF 领域 的 显 式 评分 问题 变 得 相对 困难 。 当 和 矩阵 的 信息 不 完 
整 时 ， 传 统 的 SVD 是 不 能 被 定义 的 。 而 且 ， 简 单 地 仅仅 使 用 很 少 的 已 知 信息 将 很 容易 导 
致 过 拟 合 现象 。 早 期 的 研究 依赖 于 填充 方法 L16，26]， 即 填充 用 户 一 物品 评分 矩阵 的 缺失 
值 以 使 该 矩阵 变 得 稠密 。 然 而 ， 由 于 填充 方法 极 大 地 增 大 了 数据 量 ， 所 以 代价 非常 大 。 除 
此 之 外 ， 不 准确 的 填充 也 会 使 数据 变 得 倾斜 。 因 此 ， 最 近 的 研究 [4，6，10，17，23，24， 
28] 根 据 观 察 到 的 评分 直接 建 模 ， 并 通过 充分 的 正则 化 模型 来 避免 过 拟 合 。 

在 本 节 中 ， 我 们 阐述 了 几 种 矩阵 因子 分 解 技术 ， 这 些 技术 的 准确 性 随 其 复杂 度 增加 而 
增加 。 我 们 首先 讲述 基本 模型 一 -SVD。 然 后 讲述 SVD 十 十 模型 ， 该 模型 整合 了 用 户 反 
馈 的 其 他 信息 来 提高 预测 准确 性 。 最 后 我 们 考虑 了 这 样 的 一 个 事实 : 用 户 的 爱好 或 许 会 随 
着 时 间 变 化 。 同 时 ， 由 于 用 户 的 爱好 是 不 断 变化 的 ， 他 们 甚至 会 重新 选择 他 们 的 爱好 。 这 
导致 了 一 个 因子 模型 的 产生 ， 该 模型 考虑 了 时 间 效 应 信息 用 以 更 好 地 描述 用 户 的 行为 。 


5.3.1 SVD* 


矩阵 因子 分 解 模 型 把 用 户 和 物品 两 方面 的 信息 映射 到 一 个 维度 为 二 的 联合 隐语 义 空间 
中 ， 因 此 用 户 一 物品 之 间 的 交互 作用 被 建 模 为 该 空间 中 的 内 积 。 这 个 隐语 义 空 间 试图 通过 
描述 物品 和 用 户 在 各 个 因子 上 的 特征 来 解释 评分 值 ， 而 这 些 因子 是 从 用 户 反馈 自动 推断 出 
的 。 例 如 ， 如 果 物 品 是 电影 ， 因 子 将 会 用 来 度量 如 喜剧 或 悲剧 、 情 节 的 数量 或 者 面向 儿童 
的 等 级 等 这 些 明 显 的 维度 ， 以 及 如 性 格 发 展 的 深度 或 者 “突变 ”等 隐 式 维度 ， 甚 至 是 完全 无 
法 解释 的 维度 。 

相应 地 ， 每 一 个 物品 i 都 与 一 个 了 Hel Eg; ER 相关 ， 每 一 个 用 户 都 与 一 个 也 维 向量 
PER 相关 。 给 定 一 个 物品 六 %， 向 量 的 维度 值 代表 了 该 物品 拥有 这 些 因 子 的 程度 ( 例 


© SVD(Singular Value Decomposition) 的 想法 是 根据 已 有 的 评分 情况 ， 分 析出 评分 者 对 各 个 因子 的 喜好 程度 以 
及 电影 包含 各 个 因子 的 程度 ， 最 后 再 反 过 来 根据 分 析 结 果 预 测评 分 。 一 一 译 者 注 
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如 ， 某 部 电影 的 搞笑 因子 程度 为 5、 而 慌 怖 因子 程度 为 1) ， 其 取 值 大 小 反映 了 物品 拥有 这 
些 因 子 的 积极 或 者 消极 程度 。 给 定 一 个 用 户 w， 向 量 p。 的 维度 值 代表 了 用 户 对 这 些 因子 的 
偏好 程度 (例如 ， 某 用 户 对 搞笑 因子 的 偏好 程度 为 1， 而 对 铠 怖 因子 的 偏好 程度 为 0. 1)， 
同样 地 ， 这 些 值 的 大 小 反映 了 用 户 对 这 些 因子 的 积极 或 者 消极 的 评价 。 点 积 9qip。 记录 了 
用 户 和 物品 之 间 的 交互 ， 也 就 是 用 户 对 物品 的 总 体 兴趣 度 。 加 上 之 前 提 到 的 只 依赖 于 用 户 
或 者 物品 的 基准 预测 可 以 得 到 最 终 的 评分 。 因 此 ， 评 分 通过 下 面 的 规则 预测 得 到 : 
fa = p+bi +b, qi p, (5. 2) 
为 了 学 习 模 型 中 的 参数 ， 也 就 是 5,，b;，p。，g;， 我 们 可 以 最 小 化 以 下 正则 化 的 平方 
RE: 
min >) (re —p— 6; — b, — Gi pu)? - ACE +8 + Mail + |p.l’) 


常量 44 控制 了 正则 化 程度 ， 一 般 通 过 交叉 验证 来 获得 。 最 小 化 过 程 一 般 是 通过 随机 梯度 
下 降 算 法 或 者 交替 最 小 二 乘法 来 实现 的 。 

交替 最 小 二 乘法 技术 就 是 交替 固定 p. 来 计算 q 和 固定 qi 来 计算 p,。 注 意 到 当 其 中 一 
个 是 常量 时 ， 最 优化 问题 变 成 了 二 次 的 ， 就 可 以 优化 求解 [2，4] 。 

一 种 简单 的 随机 梯度 下 降 优 化 算法 是 由 Funk 推广 [10] 的 并 在 其 他 研究 者 [17，23， 
24，28] 中 得 到 成 功 的 实践 。 该 算法 对 训练 数据 中 的 所 有 评分 做 循环 。 对 于 给 定 的 评分 re， 
其 预测 评分 记 为 名 ， 相 关 的 预测 误差 记 为 es 三 六 一 各。 对 于 给 定 的 训练 样 例 rs， 我 们 通 
过 朝 着 与 梯度 相反 的 方向 移动 来 修正 参数 ， 如 下 所 示 : 

© bb, ty * (es—As * bu) 

© b<b +7 * (es—As * b) 

© qiqi Hy e (es * Puh * qi) 

© puxputy® Cea * qi -A. * Da) 

当 在 Netflix 数据 上 评估 方法 的 时 候 ， 我 们 使 用 下 面 的 参数 值 : y — 0. 005, A40. 02, 
下 文 ， 我 们 把 这 种 方法 叫 作 SVD. 

下 面 可 以 对 该 算法 做 些 分 析 。 通 过 为 每 类 待 学 习 参 数 精心 选择 学 习 率 y 和 正则 化 因子 
4 来 提高 准确 度 。 因 此 ， 例 如 ， 可 以 对 用 户 偏 置 、 物 品 偏 置 和 因子 本 身 使 用 不 同 的 学 习 率 。 
该 策略 的 集中 使 用 在 参考 文献 [29] 中 有 详细 描述 。 在 本 章 中 ， 当 需要 产生 示范 性 的 结果 
时 ， 我 们 没有 一 直 使 用 这 个 策略 ， 而 且 在 个 别 情况 下 ， 许 多 给 定 的 常量 并 未 调整 到 最 优 。 


5.3.2 SVDT- 


考虑 隐 式 反馈 信息 可 以 增加 预测 准确 度 ， 这 些 隐 式 反馈 信息 提供 了 用 户 爱 好 的 额外 指 
示 。 这 对 于 那些 提供 了 大 量 隐 式 反馈 但 是 仅仅 提供 少量 显 式 反馈 的 用 户 尤为 重要 。 正 如 之 . 
前 解释 的 那样 ， 即 使 在 独立 的 隐 式 反馈 缺失 的 时 候 ， 我 们 也 可 以 通过 考虑 用 户 评分 的 物品 
来 得 到 用 户 兴 趣 的 信息 ， 而 无 须 考虑 这 些 物 品 的 评分 值 。 这 样 就 出 现 了 几 种 根据 用 户 评分 
的 物品 来 对 用 户 的 某 个 因子 (用 户 对 某 个 因子 的 喜好 程度 ， 比 如 ， 电 影评 分 记录 中 用 户 对 
喜剧 电影 的 喜爱 程度 因子 ) 建 模 的 方法 [17，23，25]。 本 章 重 点 关注 SVD 十 十 方法 [17j， 
可 以 证 明 这 种 方法 能 够 提供 比 SVD 方法 更 好 的 准确 度 。 


Ï 
日 ”记得 两 个 向 量 z，yE R/ 之 间 的 点 积 定义 为 zxTy = D zz * y. 
k=1 
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为 了 达到 这 个 目的 ， 我们 增加 了 第 二 个 物品 因子 集合 ， 即 为 每 一 个 物品 i 关联 一 个 因 
子 向 其 y, € R'。 这 些 新 的 物品 因子 向 基 根 据 用 户 评分 的 物品 集合 来 描述 用 户 的 特征 9 。 确 
切 的 模型 如 下 : 
Pu = p+b+b ta (p+ IROD? >) y;) (5. 3) 
其 中 ,集合 RWWA u 评分 的 所 有 物品 。 
现在 ， 用户 wu 的 因子 偏好 程度 被 建 模 为 p. 十 IROD D y, 。 正 如 式 (5.2) 一 样 ， 


j€ R(u) 


我 们 使 用 用 户 4 的 因子 偏好 程度 p,， 这 个 向 其 从 已 知 的 显 式 评分 记录 学 习 得 到 。 这 个 向 量 
HIROD V] y, 这 一 项 做 补充 ， 这 一 项 是 从 隐 式 反馈 的 角度 出 发 的 。 由 于 y; 在 0 的 附 


近 取 值 (根据 正则 化 ;， 为 了 在 观察 值 | RCo) | 的 整个 范围 内 稳定 其 方差 ， 我 们 用 |R(Cu) |? 
来 对 其 和 做 规范 化 。 

模型 的 参数 是 通过 采用 随机 梯度 下 降 方 法 最 小 化 相关 联 的 正则 化 平方 误差 函数 而 取得 
的 。 我 们 在 所 有 评分 值 已 知 的 集合 XK 上 做 循环 ， 计 算 : 

* b, bu y (eu — Às t bu) 

© b; «bit y * Ceu —Às * bi) 

eq quy (eu E (b. + IRGO E 25 y) às a qi) 

© put p, t Y* ~ Ms Pu) 

© Vij€ RGO : y, — yi y * Gu * |RGO| ? * qi — às * y) 

当 在 Netflix 数据 上 评估 方法 时 ， 我 们 使 用 下 面 的 参数 值 : y 0.007, As — 0.005, 
AM6 王 0.015。 而 且 最 好 是 每 一 次 友 代 后 减少 步 长 (也 就 是 y) 至 原来 的 0.9。 壕 代 过 程 会 持续 
30 次 迭代 直至 收敛 。 

通过 使 用 额外 的 物品 因子 集合 ， 可 以 把 几 种 类 型 的 隐 式 反馈 同时 引入 模型 中 。 例 如 ， 
如 果 一 个 用 户 w 对 N'(w) 中 的 一 些 物品 有 某 种 类 型 的 隐 式 偏好 (如 她 租借 了 它们 )， 对 
N?(w) 中 的 物品 有 另 一 种 不 同类 型 的 偏好 (如 她 检索 过 它们 )， 我 们 可 以 使 用 下 面 的 模型 . 

Pa = ud bi bug (p, -IN'GO|-* >) P+ ING? M y?) 6.4 


jEN Go je Nw) 


每 种 隐 式 反馈 信息 的 相对 重要 性 将 通过 对 模型 参数 各 自 值 的 设 定 由 算法 自动 学 习 
得 到 。 


5.3.3 时间 敏 感 的 因子 模型 


矩阵 因子 分 解 方法 能 很 好 地 对 时 间 效 应 建 模 ， 这 样 可 以 提高 预测 结果 的 准确 度 。 通 过 
把 评分 分 解 为 不 同 的 项 ， 我 们 可 以 分 别处 理 不 同方 面 的 时 序 影响 。 尤 其 是 ， 我 们 可 以 定义 
下 面 随时 间 变 化 的 因子 ， 1) 用 户 偏 置 b,(t); 2) 物 品 偏 置 5;(t); 3) 用 户 偏 好 pO. BAW 
面 ， 由 于 物品 与 人 类 不 同 ， 它 在 本 质 上 是 不 变 的 ， 所 以 我 们 也 明确 定义 了 物品 的 静态 特 


征 ， 原 因 在 于 我 们 并 不 希望 物品 有 很 大 的 时 序 变 化 。 我 们 首先 讨论 基准 预测 内 部 的 时 序 
影响 。 


日 ”前 面 提 到 的 LFM 模型 ， 即 加 入 偏 置 项 的 SVD 模型 ， 并 没有 显 式 地 考虑 用 户 的 历史 行为 对 用 户 评分 预测 的 
影响 ，SVD 十 十 模型 将 用 户 历史 评分 的 物品 信息 加 入 LFM 模型 中 。 一 一 译 者 注 
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5.3.3.1 随时 间 变 化 的 基准 预测 

基准 预测 的 时 序 变化 性 主要 体现 在 两 个 时 间 效 应 上 面 。 第 一 个 时 间 效 应 体现 在 物品 的 
流行 度 或 许 随 时 间 变 化 。 例 如 ， 在 一 部 新 电影 里 某 位 演员 的 出 现 或 许 就 会 导致 该 电影 的 流 
行 或 过 时 。 我 们 的 模型 中 把 物品 偏 置 b; 看 作 时 间 的 函数 就 能 说 明 这 一 点 。 第 二 个 时 间 效 应 
体现 在 随 着 时 间 变 化 ， 用 户 或 许 会 改变 他 们 的 基准 评分 。 例 如 ， 一 个 过 去 倾向 于 对 电影 评 
分 平均 为 4 星 的 用 户 可 能 现在 给 出 的 平均 评分 为 3 星 。 这 可 能 是 由 于 用 户 评分 标准 的 自然 
变化 ， 也 可 能 是 用 户 对 某 件 物品 的 评分 跟 最 近 他 对 其 他 物品 的 评分 有 关联 ， 也 可 能 是 一 个 
家 庭 里 面 的 评分 人 会 改变 ， 也 就 是 说 并 不 都 是 由 同一 个 人 来 评分 的 。 因 此 ， 在 我 们 的 模型 
中 ， 把 用 户 偏 置 b, 也 看 作 时 间 的 函数 。 对 一 个 时 间 敏 感 的 基准 预测 来 说 ， 在 万 天 ， 用 户 z 
对 物品 i 的 评分 可 用 下 面 公 式 来 计算 : 

b, = p+ bulta) F bilti) (95,5) 

式 中 ，b,(。) 和 6b;(。) 是 随时 间 变 化 的 实数 函数 。 构 造 这 些 函 数 最 好 的 方法 必须 要 考 
虑 如 何 参数 化 涉及 的 时 序 变 化 性 。 在 电影 评分 数据 集中 我 们 做 出 的 (构造 这 些 函 数 的 ) 选 择 
向 大 家 说 明了 一 些 典 型 的 注意 事项 。 

周期 性 变化 的 时 间 效 应 和 相对 瞬息 万 变 的 时 间 效 应 是 有 很 大 区 别 的 。 在 电影 评分 案例 
中 ， 一 方面 ， 我 们 不 希望 用 户 对 电影 的 偏好 程度 每 天 都 上 下 波动 ， 而 是 在 较 长 的 一 段 时 间 
后 才 发 生变 化 。 另 一 方面 ， 我 们 注意 到 用 户 的 影响 每 天 都 会 变 ， 这 也 反映 了 消费 者 行为 不 
是 持续 不 变 的 本 质 特 性 。 对 用 户 偏 置 的 建 模 需要 一 个 较 细 的 时 间 粒 度 ， 而 对 与 物品 相关 的 
偏 置 建 模 时 选择 一 个 相对 较 粗 的 时 间 粒 度 就 可 以 了 。 

我 们 首先 确定 如 何 选择 随时 间 变 化 的 物品 偏 置 b(t)。 我 们 发 现 完全 可 以 把 物品 偏 置 
分 割 为 不 同 的 时 间 段 来 计算 ， 而 每 一 个 时 间 段 都 用 一 个 常数 表示 物品 偏 置 。 把 时 间 轴 划分 
到 不 同 的 时 间 段 时 ， 既 希望 时 间 粒 度 较 细 ( 时 间 段 较 短 ) ， 又 需要 每 个 时 间 段 包含 足够 的 评 
分 记录 (时 间 段 较 长 )， 这 就 需要 权衡 。 对 电影 评分 数据 来 说 ， 在 相同 准确 度 条 件 下 ， 可 选 
择 的 时 间 段 大 小 的 范围 非常 宽泛 。 在 具体 的 实现 中 ， 每 一 个 时 间 段 对 应 大 约 连续 十 周 的 评 
分 数据 ， 需 要 30 个 时 间 段 来 跨度 数据 集中 的 所 有 天 数 。 天 数 上 关联 着 一 个 整数 Bin (D, 
(在 数据 集中 ， 取 值 为 1 一 30) ， 于 是 电影 偏 置 就 被 分 为 一 个 固定 部 分 和 一 个 随时 间 变 化 的 
部 分 。 

b; Ct) = bi + Bi, inc (S. 6) 

尽管 把 参数 分 时 间 段 取 值 在 物品 偏 置 上 很 好 ， 但 是 很 难 推广 到 用 户 偏 置 的 计算 上 。 一 
方面 ， 我 们 希望 对 用 户 采 用 精细 的 时 间 粒 度 ， 用 以 发 现 非常 短 时 间 的 时 间 效应 。 另 一 方 
面 ， 我 们 又 不 能 期 望 每 个 用 户 都 会 有 足够 的 评分 数据 ， 用 以 对 独立 的 时 间 段 做 出 可 靠 的 佑 
计 。 我 们 可 以 考虑 用 不 同 的 函数 形式 来 参数 化 随时 间 变 化 的 用 户 行为 ， 当 然 每 个 函数 形式 
的 复杂 度 和 准确 度 都 不 同 。 

一 个 简单 的 建 模 选择 是 使 用 一 个 线性 函数 来 模拟 用 户 偏 置 可 能 的 渐变 过 程 。 对 每 个 用 
户 wx， 定义 该 用 户 评分 日 期 的 均值 为 万 。 现 在 ， 若 用 户 x 在 上 天 的 时 候 评价 了 一 部 电影 ， 
则 与 该 评分 相关 的 时 间 偏 置 定义 为 

dev, (t) = sign(t—t,) * |t — t, |? 

WAS. [eu] ELE Me. 间隔 的 天 数 。 我 们 通过 交叉 验证 来 设置 8 的 值 ， 这 里 
采取 8=0.4。 我 们 为 每 个 用 户 引 入 一 个 单独 的 新 参数 a,， 这 样 便 得 到 了 第 一 个 与 时 间 相 关 
的 用 户 偏 置 : 

bP (t) = b, +a, * dev, (t) (5. 7) 
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这 个 用 来 近似 随时 间 变 化 的 用 户 行 为 的 简单 线性 模型 需要 为 每 一 个 用 户 wu 学习 两 个 参 
数 : B, 和 a,。 

我 们 也 可 以 采用 曲线 来 进行 更 灵活 的 参数 化 。 假 设 用 户 u An, 条 评分 记录 。 指 定 ku 
AFEA, (tio oeeo t }， 这 些 时 间 点 把 用 户 评分 记录 日 期 进行 了 均匀 的 划分 ， 并 且 作 为 
核 控 制 着 下 面 的 函数 : 


Seeli lot 
= (5. 8) 
Sel! 
参数 站 与 控制 点 (也 叫 核 ) 相 关 ， 它 们 从 数据 中 自动 学 习 得 到 。 这 样 用 户 偏 置 就 由 这 些 
参数 的 时 间 加 权 组 合 组 成 。 控 制 点 的 个 数 &, 用 于 调和 算法 灵活 性 和 计算 效率 。 在 这 里 设 
,二 no”， 使 其 随 着 可 用 的 评分 记录 增加 而 增加 。 常 量 o 决定 了 曲线 的 平滑 度 ， 通 过 交叉 
验证 将 其 值 设 为 c 一 0. 3。 
目前 为 止 ， 我 们 讨论 了 对 用 户 偏 置 建 模 时 采用 平滑 函数 ， 这 些 平滑 函数 非常 适合 模拟 
逐渐 观念 转变 的 时 间 效 应 情形 。 然 而 ， 在 很 多 应 用 中 ， 有 很 多 在 某 一 天 或 某 段 时 间 会 发 生 
瞬间 变化 的 突变 情形 。 例 如 ， 在 电影 评分 数据 集中 ， 我 们 发 现在 某 一 天 某 个 用 户 给 出 的 众 
多 评分 值 往往 集中 在 一 个 单一 的 值 。 这 样 的 结果 跨度 只 在 某 一 天 之 内 。 这 个 结果 或 许 反映 
了 用 户 当 天 的 心情 ， 或 许 是 受到 每 个 其 他 用 户 评分 的 影响 ， 或 许 是 用 户 评分 标准 的 真实 变 
化 。 为 了 处 理 这 样 短 时 间 内 存在 的 影响 ， 我 们 为 每 一 个 用 户 和 每 一 天 指定 了 一 个 参数 用 以 
反映 特定 天 的 变化 。 这 个 参数 记 为 b,.,。 注 意 在 一 些 应 用 中 ， 真 正 采 用 的 基本 时 间 单 位 可 
以 比 一 天 短 或 长 一 些 。 
在 Netflix 电影 评分 数据 中 ， 一 个 用 户 平均 在 40 个 不 同 的 日 期 对 电影 评分 。 因 此 ， 获 
得 参数 b.,, 时 ， 平 均 需 要 40 个 参数 来 描述 每 个 用 户 偏 置 。 由 于 六 .缺失 了 所 有 跨度 超过 一 
天 的 信息 ， 所 以 把 任务 b,,, 作 为 单独 的 一 个 变量 并 不 能 充分 地 处 理 用 户 偏 置 。 因 此 ， 把 它 
作为 前 面 描述 过 的 模式 中 的 一 个 附加 部 分 。 于 是 ， 时 间 线 性 模型 (5. 7) 变 成 : 


bP (t) = b, ta, * dev, (t) + b, (5.9) 
相 类 似 ， 基 于 曲线 的 模型 变 成 下 面 的 模型 ; 
ka 
Yel la 
Am O = 六 十 一 一 一 十 和 (5. 10) 
Yell 
= 


仅 靠 基 准 预 测 并 不 能 产生 个 性 化 推荐 ， 原 因 在 于 它 忽略 了 用 户 和 物品 之 间 的 所 有 交 
互 。 在 某 种 意义 上 ， 它 只 是 抓 住 了 与 建立 推荐 不 是 很 相关 的 那 部 分 数据 。 然 而 ， 为 了 比较 
与 时 间 相关 的 、 不 同类 别 的 用 户 偏 置 的 优 缺点 ， 我 们 在 单个 预测 器 上 比较 它们 的 准确 度 。 
为 了 学 习 模 型 中 涉及 的 参数 ， 我 们 用 随机 梯度 下 降 算法 来 最 小 化 相关 的 正则 化 平方 误差 。 
例如 ， 在 真实 的 实现 中 ， 我 们 采用 规则 (5. 9) 来 对 随时 间 变 化 的 用 户 偏 置 建 模 ， 这 样 得 到 
下 面 的 基准 预测 器 : 

bs = wtb, +a, * dev, (ts) F Bu, T bi boo (5. 11) 

为 了 学 习 涉 及 的 参数 bu, aur buf. bpino， 这 里 等 价 于 解决 下 面 的 最 小 化 问题 : 

min S Gu "dcc — a, dev, (4, ) — bu, —b; — bi ince, ) ?十 X71 Gi, FH au 二 be +6; TT Disc ) 


(WDEK 
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里 ， 第 一 项 试图 构造 与 已 知 评分 拟 合 得 最 好 的 参数 。 正 则 化 项 A: i+) BUMS 
数 的 大 小 进行 惩罚 来 避免 过 拟 合 现象 ， 这 些 参数 的 初始 值 设 为 0。 学 习 过 程 是 通过 随机 梯 
度 下 降 算法 在 20 一 30 次 迭代 之 后 完成 的 ， 其 中 A; —0.01, 

表 5. 1 比较 之 前 提出 的 几 种 基准 预测 器 解读 数据 中 信息 的 能 力 。 与 往常 一 样 ， 捕 获 的 
信息 是 由 根 均 方差 (RMSE) 来 度量 的 。 在 此 提醒 一 下 ， 由 于 测试 案例 在 时 间 上 比 训练 样 例 
出 现 的 晚 ， 所 以 预测 经 常 涉及 关于 时 间 的 外 推 法。 我们 可 以 这 样 表示 这 些 基准 预测 器 : 


表 5.1 电影 和 用 户主 要 影响 的 基准 预测 器 之 间 的 比较 。 随 着 时 序 建 模 越 来 越 准确 ， 预 测 准 确 性 也 


ed 变 小 ) 
0. 979 9 0.9771 0.9731 0.9714 0. | 0995 | 
。 静态 模型 ， 不 考虑 时 间 效 应 : bui =y b. bi. 
* Mov 模型 ， 只 考虑 与 电影 相关 的 时 间 效 应 : ba =y tbu bi Discs o 
。 线性 模型 ， 考 虑 用 户 偏 置 的 线性 模型 bu =a Fb Tas. dev, Ct ) Fb; Fbi, Bina) o 
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5 en lta | 
- 样 条 曲线 模型 ， 考 虑 用 户 偏 置 的 样 条 曲线 模型 : bu = /十 六 十 二 — tht 
i: e" | tut | 


bi sin © 


* jlinear 十 模型 ， 考 虑 用 户 偏 置 和 单 天 效应 的 线性 模型 : 0; =p tbu Hau. dev, (ty) + 
b; b... Fbi, Bine > o 


k 
er (iama | OF 


* spline 十 模型 ， 考 虑 用 户 偏 置 和 单 天 效应 的 样 条 曲线 模型 : bs = p+, + + 
Seth | 
b; + bi + Duas o 

表 5. 1 显示 ， 尽 管 考 虑 电影 评分 数据 中 电影 的 时 间 效应 立 提 高 了 预测 准确 度 ( 把 RMSE 
从 0. 9799 降低 到 0. 9771) ， 但 相 比 之 下 ， 用 户 偏 置 的 变化 影响 更 大 。 跟 线性 模型 相 比 ， 建 
模 时 使 用 样 条 曲线 增加 了 额外 的 灵活 性 ， 因 此 提高 了 预测 准确 度 。 然 而 ， 由 每 天 参数 捕获 
的 用 户 偏 置 的 突变 才 是 最 重要 的 。 事 实 上 ， 当 考虑 这 些 突变 时 ， 线 性 模型 (linear 十 ) 和 样 
条 曲线 模型 (spline 十 ) 的 区 别 几乎 消失 了 。 

除了 捕捉 目前 描述 的 时 间 效 应 ， 可 以 通过 相同 的 方法 捕获 更 多 的 其 他 效应 。 一 个 主要 
的 案例 是 捕获 季节 效应 。 例 如 ， 一 些 产 品 或 许 在 特定 季节 或 者 临近 某 些 假期 时 才 会 流行 。 
相 类 似 ， 电 视 或 者 电台 节目 在 一 天 的 不 同时 间 段 内 才 会 流行 (也 就 是 “分 时 段 ?) 。 季 节 效 应 
也 可 以 在 用 户 端 出 现 。 例 如 ， 用 户 或 许 在 周 六 日 和 工作 日 有 不 同 的 心态 或 者 购买 模式 。 对 
这 样 的 效应 建 模 的 一 种 方式 是 用 一 个 参数 把 时 间 周 期 和 用 户 或 物品 结合 起 来 。 这 样 ， 
式 (5. 6) 所 示 的 物品 偏 置 变 为 : | 

b(t) = bi + bi,pinc) F bi, periodo 

例如 ， 如 果 我 们 试图 捕获 物品 偏 置 在 一 年 不 同 季节 内 的 变化 ， 则 period (1) € 
(fall, winter, spring, summer). 。 相 类 似 ， 我 们 或 许可 以 通过 把 式 (5. 9) 修 改 为 下 面 的 公 
式 来 对 周期 性 的 用 户 影响 建 模 : 
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ba(t) = b, Hau * dev, (t) + bu, F Bu, period 
然而 ， 尚 未 发 现 季 节 效 应 在 电影 评分 数据 集中 有 重要 的 预测 能 力 ， 因 此 我 们 报告 的 结 
果 并 没有 包含 这 些 季 节 效 应 。 
另 一 种 基准 预测 器 范围 内 的 时 间 效 应 是 与 用 户 评分 标准 的 变化 相关 的 。 尽 管 b, (4) 是 
一 个 与 用 户 无 关 的 、 在 时 刻 :关于 物品 i 价值 的 度量 ， 用 户 却 倾向 于 对 这 样 的 一 个 度量 做 
出 不 同 的 回应 。 例 如 ， 不 同 的 用 户 有 不 同 的 评分 标准 ， 并 且 是 同一 个 用 户 的 评分 标准 也 会 
随 着 时 间 改 变 。 于 是 ， 电 影 偏 置 的 原始 数值 就 不 是 完全 与 用 户 无 关 的 了 。 为 了 解决 这 个 问 
题 ， 我 们 为 基准 预测 器 增加 一 个 与 时 间 相 关 的 扩展 特征 ， 记 为 c. CO . PRG. SEHE TRUM SS 
式 (5. 11) 变 成 : 
b, = wtb, +a, * dev, (tu) F Bu, GO F binmu) * Calta) (5. 12) 
上 面 讨 论 的 用 于 实现 六 (oO 的 方法 都 可 以 用 来 实现 c, CO 。 我 们 设 定 一 个 随 天 数 变化 的 
单独 参数 ， 得 到 CO 二 c 十 c,。 与 往常 一 样 ，c 是 (0 的 稳定 部 分 ， 而 cv ORE T EE 
天 的 变化 。 把 c(t) 当 作 一 个 乘法 因子 增加 到 基准 预测 器 可 以 把 RMSE 降低 到 0. 9555。 有 
趣 的 是 ， 只 捕获 主要 影响 而 完全 忽略 用 户 一 物品 交互 作用 的 基本 模型 ， 与 商业 化 的 Netflix 
Cinematch 推荐 系统 一 样 ， 都 可 以 用 来 解释 大 部 分 的 数据 变化 。 在 相同 的 测试 集 上 ，Net- 
flix Cinematch 推荐 系统 报告 的 RMSE 为 0. 9514[5]。 
5.3.3.2 随时 间 变 化 的 因子 模型 
在 5.3.3.1 节 中 ， 我 们 讨论 了 时 间 因 子 对 基准 预测 器 的 影响 。 然而 ， 正 如 之 前 提 到 的 
那样 ， 时 间 效 应 不 仅 对 基准 预测 器 有 影响 ， 也 对 用 户 的 偏好 有 影响 ， 从 而 影响 用 户 和 物品 
之 间 的 交互 作用 。 用 户 的 偏好 随 着 时 间 变 化 。 例 如 ,， “心理 惊悚 片 ” 类 型 的 电影 迷 或 许 一 年 
后 变 成 “罪案 片 ”的 电影 迷 。 相 类 似 ， 人 们 会 改变 他 们 对 特定 导演 和 演员 的 看 法 。 这 种 演进 
通过 把 用 户 因子 (向 量 p, ) 作 为 时 间 的 函数 来 建 模 。 再 一 次 ， 我 们 需要 在 面临 用 户 评分 的 内 
置 稀 朴 性 的 困境 下 ， 以 每 天 这 样 的 精细 时 间 粒 度 来 对 这 些 变化 建 模 。 事 实 上 ， 这 些 时 间 效 
应 是 最 难 捕获 到 的 ， 因 为 用 户 偏好 并 不 像 主 要 影响 (用 户 偏 置 ) 那 样 明显 ， 而 是 被 分 割 成 了 
许多 因素 。 
与 处 理 用 户 偏 置 的 方式 相似 ， 我 们 对 用 户 偏好 的 每 一 个 组 成 部 分 进行 建 模 ， 即 
b, ( 二 (pu(t)，…，pw(t))。 在 电影 评分 数据 集中 ， 我 们 发 现 以 式 (5.9) 来 建 模 是 很 有 
效 的 ， 如 下 所 示 : 
ba OG) = pu tau * dev (t) + puar ko l,sf (5. 13) 
RB, putt RAF WARY, au * dev, (1) 是 对 可 能 随时 间 线 性 变化 的 那 部 分 的 近 
似 ，pua, 代 表 了 非常 局 部 性 的 、 与 特定 天 相关 的 变化 。 
这 时 ,我们 可 以 把 所 有 的 碎片 拼凑 起 来 并 通过 整合 这 些 随时 间 变 化 的 参数 来 扩展 SVD 
因子 模型 。 得 到 的 扩展 模型 记 为 timeSVD 十 十 ， 且 预测 规则 如 下 所 示 ， 


iy = Bc bia F bua, t qi (bau + | R(u) | > »;) (5. 14) 


jE RG) 
随时 间 变 化 的 参数 O, CRI pu COTES CS. 6) SECS. 9) RISE CS. 13) 中 有 精确 的 定 
义 。 学 习 过 程 通过 使 用 随机 梯度 下 降 算法 来 最 小 化 数据 集 上 相关 的 平方 误差 函数 来 完成 。 
整个 过 程 与 原始 的 SVD 十 十 算法 类 似 。 每 一 次 迭代 的 时 间 复 杂 度 仍然 与 输入 大 小 呈 线 性 关 


系 ， 而 运行 时 间 大 概 是 SVD 十 十 算法 的 两 倍 ， 原 因 是 更 新 时 序 参数 需要 额外 的 花费 。 重 要 
的 是 ， 收 敛 速度 并 没有 受 时 序 参数 化 的 影响 ， 大 概 经 历 30 次 迭代 后 该 算法 就 会 收敛 。 
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5.3.4 比较 


表 5. 2 比较 了 本 节 讨 论 的 三 种 算法 的 结果 。 首 先是 SVD 方法 ， 最 原始 的 矩阵 分 解 算 
法 。 其 次 是 SVD 十 十 方法 ， 该 方法 在 SVD 的 基础 上 整合 了 一 种 隐 式 反馈 ， 因 此 提高 了 预 
测 准确 度 。 最 后 是 timeSVD 十 十 ,该 模型 考虑 了 时 间 效 应 。 这 三 种 方法 在 一 系列 分 解 维度 
( 几 ) 进 行 了 比较 。 三 种 方法 的 预测 准确 度 都 随 着 因子 维度 数目 的 增加 而 提高 ， 原 因 是 因子 
维度 个 数 越 高 ， 它 们 表达 电影 一 用 户 的 复杂 交互 的 能 力 就 越 强 。 注 意 到 SVD 十 十 模型 中 参 
数 的 数量 跟 SVD 是 相当 的 。 这 是 因为 SVD 十 十 模型 只 是 加 入 了 物品 方面 的 影响 ， 而 数据 
集 的 复杂 度 是 由 更 大 的 用 户 集 来 决定 的 。 另 一 方面 ，timeSVD 十 十 模型 需要 更 多 的 参数 ， 
因为 它 精确 表示 了 每 一 个 用 户 因子 。 在 SVD 十 十 模型 中 增加 隐 式 反馈 也 可 以 提高 在 电影 评 
分 数据 集 上 的 预测 准确 度 。 但 是 ,与 SVD 十 十 模型 相 比 ，timeSVD 十 十 模型 带 来 的 预测 准 
确 度 的 提高 一 直 都 很 明显 。 我 们 尚未 发 现 文献 中 的 哪个 单独 的 算法 能 够 有 如 此 高 的 准确 度 。 
捕获 时 间 效 应 的 重要 性 进一步 体现 了 这 样 的 一 个 事实 : 因子 维度 为 10 的 timeSVD 十 十 模型 
已 经 比 因子 维度 为 200 的 SVD 模型 性 能 好 。 相 类 似 ， 因 子 维度 为 20 的 timeSVD 十 十 模型 
已 经 比 因子 维度 为 200 的 SVD 十 十 模型 性 能 好 。 


表 5.2 三 种 因子 模型 的 比较 : 预测 准确 性 是 在 不 同 因 子 维度 (f) 下 由 RMSE 度量 的 (RMSE 越 小 ， 证 
明 预 测 准 确 性 越 高 )。 对 于 所 有 的 模型 ， 准 确 度 随 因子 维度 的 个 数 增 加 而 提高 。SVD+ + 模 
型 在 SVD 模型 的 基础 上 整合 了 隐 式 反馈 ， 因 子 提高 了 准确 度 。timeSVD 在 SVD- 十 的 基础 
上 增加 了 数据 中 时 间 效 应 的 影响 ， 因 此 进一步 增加 了 准确 度 









SVD-T + 








timeSVD+ + 


5.3.4.1 预测 未 来 日 期 


我 们 的 模型 包含 了 特定 天 的 参数 。 一 个 明显 的 问题 就 是 如 何 使 用 这 些 模 型 来 预测 未 来 
的 评分 ， 即 对 我 们 还 不 能 训练 特定 天 的 参数 的 这 些 日 期 进行 评分 。 一 个 简单 的 答案 是 对 于 
这 些 未 来 (未 训练 ) 的 日 期 ， 特 定 日 期 的 参数 应 该 取 默 认 值 。 也 就 是 ， 对 于 式 (5. 12)， 
Cute BW Cus bur, 设 为 0。 然 而 ， 有 人 会 问 ， 如 果 我 们 不 能 使 用 这 些 特定 天 的 参数 来 预测 
未 来 的 日 期 ， 那 这 些 参 数 在 什么 地 方才 有 用 呢 ? 毕竟 ， 预 测 只 有 关乎 未 来 才 是 有 用 的 。 为 
了 使 这 个 问题 更 加 清晰 ， 我 们 需要 提 到 这 样 一 个 事实 : 在 Netflix 数据 集中 包括 了 很 多 用 
户 在 某 些 日 期 只 有 一 条 评分 记录 的 数据 ， 因 此 ， 特 定 日 期 的 参数 不 能 使 用 。 

为 了 回答 这 个 问题 ， 需 要 注意 时 序 化 建 模 并 没有 试图 捕获 未 来 的 变化 。 我 们 的 时 序 化 
建 模 试图 做 的 是 捕获 瞬息 万 变 的 动态 时 序 ， 这 些 动态 时 序 对 用 户 过 去 的 反馈 有 很 大 的 影 
响 。 当 我 们 识别 出 这 些 时 间 效应 时 ， 应 该 对 它们 进行 向 下 调整 ， 以 便 我 们 能 够 对 更 加 持久 
化 的 信号 建 模 。 这 样 ， 模 型 就 可 以 更 好 地 捕获 数据 的 长 期 特征 ， 而 使 用 精心 设计 的 参数 来 
表示 短期 的 波动 。 例 如 ， 如 果 一 个 用 户 某 天 给 出 了 很 多 比 平 时 评分 要 高 的 评分 ， 我 们 的 模 
型 将 会 对 这 些 评分 给 予 一 定 的 折扣 ， 因 为 考虑 到 这 可 能 是 用 户 在 特定 天 的 好 心情 造成 的 ， 
而 这 并 不 能 反映 该 用 户 长 期 的 行为 。 这 样 ， 特 定 天 的 参数 完成 了 一 种 数据 清理 工作 ， 而 这 
种 数据 清理 提高 了 对 未 来 日 期 的 预测 准确 度 。 
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5.3.5 总 结 


和 矩阵 分 解 模 型 的 基本 形式 描述 了 物品 和 用 户 两 方面 的 特征 ， 而 这 是 通过 由 物品 的 评分 
模式 推导 出 的 向 量 因 子 实现 的 。 物 品 和 用 户 因子 间 的 高 度 一 致 性 才 会 导致 一 个 物品 被 推荐 
给 一 个 用 户 。 这 些 方法 的 预测 准确 度 要 优 于 已 经 发 表 的 其 他 协同 过 滤 技术 。 同 时 ， 这 些 方 
法 提供 了 一 个 内 存 有 效 的 压缩 模型 ， 该 模型 训练 起 来 相对 容易 。 这 些 优点 ， 加 上 基于 梯度 
下 降 算法 的 矩阵 分 解 模 型 实现 起 来 很 容易 ， 使 得 该 方法 成 为 Netflix 有 奖 比 赛 中 使 用 的 方 
es 

这 些 技 术 在 处 理 数 据 多 个 关键 方面 的 能 力 使 得 它们 在 实际 应 用 中 更 加 方便 。 首 先 ， 是 
整合 多 种 形式 的 用 户 反 馈 的 能 力 。 我 们 可 以 观察 用 户 其 他 相关 的 行为 来 更 好 地 预测 该 用 户 
的 评分 ， 如 用 户 的 购买 或 者 浏览 历史 记录 。 提 出 的 SVD 十 十 模型 利用 了 多 种 形式 的 用 户 反 
馈 来 提高 用 户 评分 的 预测 准确 度 。 

另 一 个 重要 方面 是 时 间 效 应 ， 这 些 时 间 效 应 反映 了 用 户 随时 间 变 化 的 爱好 。 每 一 个 用 
户 和 产品 在 其 特征 上 都 会 潜在 地 经 历 一 系列 不 同 的 变化 。 在 随时 间 变 化 的 数据 中 ， 仅 仅 靠 
旧 实 例 的 衰减 不 能 充分 地 识别 出 公共 的 行为 模式 。 我 们 采用 的 解决 方法 是 在 整个 时 期 对 时 
间 效 应 建 模 ， 这 样 就 可 以 智能 地 把 瞬 态 因子 和 持续 性 的 因子 分 离开 。 包 含 时 间 效应 的 模型 
被 证 明 在 提高 预测 质量 方面 比 算法 上 的 增强 更 有 用 。 


5.4 基于 邻 域 的 模型 


协同 过 滤 领 域 最 常见 的 方法 是 基于 邻 域 的 模型 。 第 4 章 对 该 方法 进行 了 广义 概括 。 其 最 
原始 形式 是 基于 用 户 的 ， 该 形式 是 早期 所 有 CF 系统 采用 的 共同 方法 ， 参 见 文献 [14] 来 得 到 
更 好 的 分 析 。 基 于 用 户 的 方法 是 基于 一 群 志趣 相同 的 用 户 的 评分 记录 来 估计 未 知 的 评分 。 

随后 ， 一 种 类 似 的 基于 物品 的 方法 L[20，27] 流 行 起 来 。 在 这 些 方法 中 ， 我 们 使 用 同一 
个 用 户 在 相似 物品 上 的 评分 来 估计 未 知 的 评分 。 由 于 基于 物品 的 方法 具有 更 好 的 可 扩展 性 
并 提高 了 准确 度 ， 所 以 该 方法 在 很 多 种 场景 中 都 适用 [2，27，28]。 除 此 之 外 ， 基 于 物品 
的 方法 能 更 好 地 解释 预测 背后 的 原因 。 这 是 因为 用 户 对 他 们 之 前 喜爱 过 的 物品 比较 熟悉 ， 
但 是 他 们 却 不 认识 这 些 所 谓 的 志趣 相同 的 人 。 我 们 主要 关注 基于 物品 的 方法 ,但 是 同样 的 
技术 可 以 在 基于 用 户 的 方法 中 直接 使 用 ， 可 以 参考 5. 5. 2. 2 节 。 

一 般 来 说 ， 隐 语义 模型 在 描述 数据 的 各 种 方面 具有 很 强 的 表达 能 力 。 因 此 它们 的 预测 
结果 一 般 比 基于 邻 域 的 模型 要 好 。 然 而 ， 大 多 数 文献 和 商业 系统 (例如 ，Amazon[20] 和 
TivoL1j] 的 推荐 系统 ) 都 是 以 基于 邻 域 的 模型 为 基础 的 。 基 于 邻 域 的 模型 之 所 以 如 此 普遍 部 
分 ， 是 因为 它们 相对 简单 。 然 而 ， 现 实生 活 中 坚持 采用 这 种 模型 有 更 重要 的 原因 。 首 先 基 
于 邻 域 的 模型 提供 了 推荐 背后 的 直观 解释 ， 这 种 解释 不 仅 提高 了 准确 性 ， 同 时 增强 了 用 户 
体验 (解释 推荐 系统 的 更 多 内 容 在 本 书 第 15 章 中 有 更 多 叙述 ) 。 其 次 ， 基 于 邻 域 的 模型 能 
够 根据 一 个 新 进入 系统 的 用 户 反馈 立即 提供 推荐 。 

本 节 的 结构 如 下 。 首 先 ， 描 述 如 何 估计 两 个 物品 之 间 的 相似 度 ， 这 是 大 多 数 基于 邻 域 
的 模型 的 基础 。 其 次 ， 我 们 转 到 广泛 使 用 的 基于 相似 度 的 邻 域 方法 ， 该 方法 构成 了 相似 度 
权重 的 一 个 直接 应 用 。 我 们 指出 这 种 基于 相似 度 的 方法 的 一 些 特定 的 限制 。 最 后 ， 在 
5.4.3 节 中 ， 给 出 解决 这 些 问 题 的 建议 方法 ， 通 过 这 种 方法 ， 可 以 以 计算 时 间 上 微小 的 增 
加 为 代价 来 提高 预测 准确 度 。 
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5.4.1 相似 度 度量 


基于 物品 的 方法 的 核心 是 物品 之 间 的 相似 度 度量 。 一 般 情况 下 相似 度 的 度量 是 基于 皮 
尔 逊 相关 系数 oj， de ede ee a Mei iip: 进行 评分 的 相似 性 趋势 。 由 于 
许多 评分 未 知 ， 一 些 物 品 或 许 只 ee 经 验 相关 系数 by 仅仅 是 基于 共同 
的 用 户 支 持 。 我 们 建议 用 基准 预测 器 的 残 差 (bs ， 见 5. 2. 1 节 ) 来 补偿 特定 用 户 和 特定 物品 
的 偏差 。 因 此 ， 近 似 的 相关 系数 如 下 所 示 : 

M3 Craba) Cry — by) 
py = nce (5. 15) 


1] 2) ry = bu) o > (ry —5,2^ 
RRUG, 旋 包 含 了 同时 对 物品 i Al j 评分 的 用 户 。 
由 于 基于 更 大 的 用 户 支 持 的 相关 系数 估计 值 更 加 可 靠 ， 所 以 我 们 可 以 使 用 一 种 近似 的 
相似 度 度 量 ， 记 为 ;; ， 这 是 一 个 相关 系数 的 收缩 值 ， 其 形式 如 下 : 
def ny — 1 
i = Tah 
变量 ny = (UG, D | 记 为 同时 对 物品 i 和 j 评分 的 用 户 的 数量 。)s 的 典型 值 可 取 100. 
这 样 收缩 是 从 贝 叶 斯 角度 出 发 的 ， 参 考 2. 6 节 中 Gelman 等 的 文献 [11]。 假 设 真实 的 
mo 是 服从 正 态 分 布 的 独立 随机 变量 ， 即 给 定 C: 
py ~ NG,2) 
如 果 .考虑 到 用 户 和 物品 对 各 自 均 值 的 偏离 ， 均 值 被 调整 为 0。 同 时， 给 定 oj, 


假设 : 








(5. 16) 


i le; diee N (pij 10; ) 
我 们 通过 其 后 验 均 值 来 估计 p; : ECps | 0s) = FÊ. 经 验 估 计 值 b; 在 趋 于 0 时 缩小 了 


一 个 比例 o; / C +3). 
X. 16) 通 过 等 式 o; —1/(nj 一 1) 来 通 近 相关 系数 的 方差 ， 此 时 pi 的 值 接 近 于 0, 
注意 文献 L27，28] 提 出 了 相似 度 度 量 的 其 他 方法 。 


5.4.2 ”基于 相似 度 的 插值 


这 里 描述 基于 邻 域 建 模 的 最 流行 方法 ， 显 然 该 方法 对 一 般 意义 上 的 CF 也 适用 。 我 们 
的 目标 是 预测 ra 尚未 观察 到 的 用 户 x 对 物品 i 的 评分 。 使 用 这 种 相似 度 度量 ， 我 们 可 
以 找到 用 户 评分 的 、 与 物品 i 最 相似 的 & 个 物品 。 这 个 由 不 个 近邻 物品 组 成 的 集合 记 为 
S*(i; u)。rw 的 预测 值 取 用 户 对 这 些 紧 邻 物品 评分 的 加 权 平 均 ， 同 时 用 户 和 物品 在 基准 预 
测 器 的 影响 下 做 调整 ， 得 到 的 预测 规则 如 下 : 


22 Sij (ry by) 





Pui =p. EN o (5. 17) 
jeS iw 
注意 相似 度 的 双重 用 途 : 一 是 识别 出 最 近 的 近邻 物品 ;二 是 作为 式 (5.17) 中 的 插值 


权重 。 
有 时 ， 除 了 直接 把 相似 度 权重 作为 插值 系数 ， 我 们 也 可 以 转换 这 些 权重 来 得 到 更 好 的 
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结果 。 例 如 ， 我 们 已 经 在 一 些 数据 集中 发 现 取 基于 关联 的 相似 度 的 平方 值 很 有 用 。 这 样 得 


BE Si (ry — by) 


到 的 规则 : Fui = bu NE. M o Toscher 等 在 文献 [31] 中 讨论 了 这 些 权重 更 复杂 
Sij 


je S Guo 


的 转换 形式 。 
基于 相似 度 的 方法 之 所 以 变 得 这 么 流行 ， 是 因为 它们 很 直观 ， 并 且 实 现 起 来 相对 简 
单 。 它 们 还 具有 下 面 两 个 很 有 用 的 特性 。 

。 可 解释 性 。 解 释 自动 推荐 系统 的 重要 性 在 文献 [13，30] 中 得 到 广泛 认可 ， 也 可 以 
参考 第 15 章 。 用 户 希 望 系统 给 出 预测 的 原因 ， 而 不 是 像 " 黑 盒 "一样 仅仅 展示 推荐 
列表 。 解 释 不 仅 丰富 了 用 户 体验 ， 而 且 可 以 鼓励 用 户 与 系统 交互 、 修 正 与 主观 印 
象 违背 的 内 容 来 提高 长 期 的 准确 性 。 基 于 邻 域 的 框架 可 以 识别 出 用 户 过 去 的 哪个 
行为 对 计算 出 来 的 预测 影响 最 大 。 

。 新 的 评分 。 基 于 物品 的 邻 域 模型 能 够 在 用 户 输入 新 的 评分 后 立即 给 出 更 新 过 的 推 
荐 结果 。 这 包括 一 旦 用 户 对 系统 提供 反馈 时 就 立即 处 理 新 的 用 户 ， 而 不 需要 重新 
训练 模型 以 及 估计 新 的 参数 。 这 里 假设 物品 之 间 的 关系 (s; 的 值 ) 是 稳定 的 ， 并 不 
是 每 天 都 变 。 注 意 对 于 新 进入 系统 的 物品 ， 我 们 确实 需要 学 习 新 的 参数 。 有 趣 的 
是 ， 用 户 和 物品 间 的 这 种 非 对 称 性 在 常见 的 应 用 中 配合 得 很 好 : 系统 需要 对 新 进 
人 系统 的 用 户 ( 或 者 老 用 户 的 新 评分 ) 立 即 做 出 推荐 ， 因 为 这 些 用 户 期 望 有 质量 的 
服务 。 另 一 方面 ， 物 品 进 入 系统 后 ， 等 待 特定 时 间 再 把 它们 推荐 给 用 户 也 是 合 情 
合理 的 。 

然而 ， 基 于 邻 域 的 标准 模型 也 面临 下 面 的 问题 : | 

。 直接 定义 插值 权重 的 相似 度 函 数 (s ) 是 任意 取 的 。 不 同 的 CF 算法 使 用 多 少 有 点 不 
同 的 相似 度 度量 ， 用 以 量化 用 户 相似 度 或 者 物品 相似 度 这 一 难以 捉摸 的 概念 。 假 
设 一 个 特定 的 物品 的 评分 可 由 其 近邻 物品 的 一 个 子 集 完 美 地 预测 出 来 。 这 种 情形 
下 ， 我 们 想 让 这 个 预测 子 集 能 得 到 所 有 的 权重 ， 但 是 这 对 于 像 使 用 皮尔 逊 相关 系 
数 这 样 的 有 界 相似 度 得 分 是 不 可 能 的 。 

。 之 前 基于 邻 域 的 方法 没有 考虑 近邻 物品 之 间 的 相互 作用 。 物 品 ; 和 其 近邻 物品 j 的 
每 一 个 相似 度 在 计算 时 是 完全 独立 于 集合 S" (i; zx) 的 内 容 和 其 他 相似 度 i 的， 其 
PES CG; u)— {j}. 例如， 假设 物品 是 电影 ， 邻 域 集合 包含 了 相互 之 间 高 度 相 
关 的 三 部 电影 (例如 ,， “指环 王 1~3” 续 集 )。 在 决定 插值 权重 时 ， 如 果 一 个 算法 忽 
略 了 这 三 部 电影 的 相似 性 ， 则 最 终 或 许 会 把 该 组 物品 提供 信息 实际 计算 三 次 。 

。 根据 定义 ,插值 权重 的 和 为 1， 这 或 许 会 导致 过 拟 合 。 假 设 一 个 物品 没有 被 某 个 特 
定 用 户 评分 的 有 用 的 近邻 。 这 种 情况 下 ， 最 好 忽略 掉 邻 域 信 息 ， 直 接 根据 更 具 健 
壮 性 的 基准 预测 器 进行 预测 即 可 。 然 而 ， 标 准 邻 域 公式 使 用 了 这 些 不 提供 有 用 信 
息 的 近邻 物品 评分 的 加 权 平 均 。 

。 如 果 近 邻 间 物 品 的 评分 变化 太 大 ， 基 于 邻 域 的 方法 工作 得 不 好 。 

其 中 一 些 问题 可 以 在 一 定 程 度 上 得 到 解决 ， 然 而 其 他 问题 在 基本 框架 内 很 难 解决 。 例 

如 ， 第 三 个 问题 ， 处 理 权 重 之 和 为 1 的 约束 时 ， 可 以 使 用 下 面 的 预测 规则 缓解 这 个 约束 ， 
Si (ry — by) 


£a = by 十 ies (5.18) 


Ao + > Sij 
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BHA 代表 了 当 近 邻 信息 很 少时 对 基于 邻 域 的 部 分 的 惩罚 , 例如, 4 》) s KA 
jes* a) 
时 。 确 实 ， 我 们 已 经 发 现 ， 为 1。 设 定 一 个 合适 的 值 能 够 在 式 (5. 17) 基 础 上 提高 准确 性 。 
ck Meese a ater LE, 因此 ， 我 们 试图 用 一 种 更 加 基础 的 方法 来 得 
到 更 好 的 结果 ， 下 面 讨 论 这 种 方法 。 


5.4.3 联合 派生 插值 权重 


本 节 描 述 一 种 更 加 准确 的 邻 域 模型 ， 该 模型 克服 了 上 面 讨论 的 所 有 困难 ， 同 时 又 保持 
了 基于 物品 的 模型 的 已 知 优点 。 与 上 面 一 样 ， 我 们 为 每 一 个 预测 使 用 相似 度 度量 来 定义 近 
45. 然而， 我 们 寻找 最 优 插值 时 并 没有 考虑 相似 度 度量 的 值 。 
给 定 一 个 近邻 集合 SG; u)， 我 们 需要 计算 插值 权重 {8 |j € S (i; u))}， 通 过 这 些 权 
重 可 以 得 到 下 面 形 式 的 最 好 预测 规则 : 
fs = by + b» apr, — by?) E (5. 19) 
jes*aiw 
k( 近 邻 的 个 数 ) 的 典型 取 值 范围 为 20~50， 参 考 文献 [2]。 在 本 节 中 ， 我 们 假设 基准 预 
测 器 已 经 被 移 除 。 因 此 ， 我 们 为 残 差 引入 一 个 符号 ，z 空 rs 一 bs 。 为 了 使 符号 方便 使 用 ， 
我 们 假设 集合 SG; z) 中 物品 的 索引 为 1，…，A。 
寻找 直接 在 预测 规则 (5. 19) 使 用 的 插值 权重 的 正式 的 计算 方法 。 正 如 之 前 解释 过 的 那 
样 ， 推 导 所 有 插值 权重 时 同时 考虑 近邻 物品 之 间 的 相互 依赖 是 很 重要 的 。 我 们 通过 定义 一 
个 相应 的 最 优化 问题 来 达到 这 些 目的 。 
5.4.3.1 形式 化 模型 
首先 ， 考 虑 一 种 假设 密集 的 情形 ， 在 这 种 情形 里 ， 除 了 u 的 所 有 用 户 都 同时 对 物品 ; 
MEERA S Gs z) 中 的 所 有 近邻 物品 进行 评分 。 这 种 情形 下 ， 我 们 可 以 通过 对 物品 和 
它 的 近邻 物品 之 间 的 关联 进行 建 模 来 学 习 这 些 插值 权重 ， 建 模 是 通过 解决 下 面 的 最 小 二 乘 
法 问题 完成 的 : 
min 2, (zs — 2 Gs) (5. 20) 


jes* can 


注意 ， 这 里 唯一 的 未 知 量 是 % 。 该 最 小 二 乘法 问题 (5. 20) 的 最 优 解 是 通过 转化 为 求解 
一 个 线性 方程 组 而 得 到 的 。 从 统计 学 的 角度 看 ， 这 等 价 于 在 zu CO EX eu ET ARIE 
的 结果 。 特 别 地 ， 最 优 权重 由 下 面 的 等 式 给 出 : 
Aw —b (5. 21) 
这 里 ，zwE R* 是 一 个 未 知 向 量 ， 其 中 w 代表 要 寻找 的 系数 0%。A 是 一 个 kXk 甜 阵 ， 
其 中 ， 
= yzuzu (5. 22) 


相 类 似 ， 向 量 DC R* 定义 如 下 : 
hc Posuit (5. 23) 
vÉ 


IFAR A AT BE Dt Xt H d i 和 其 邻 域内 的 物品 进行 评分 的 用 户 很 
少 。 因 此 ， 把 式 (5. 22) 和 式 (5. 23) 所 示 的 A 和 4 仅仅 基于 那些 有 完整 数据 的 用 户 的 数据 去 
计算 是 不 明智 的 。 即 使 有 足够 多 的 包含 完整 数据 的 用 户 来 保证 矩阵 A 是 非 奇异 的 ， 那 样 的 
估计 也 会 忽略 同一 个 用 户 评分 之 间 的 成 对 关系 的 大 部 分 信息 。 然 而 ， 通 过 在 给 定 的 成 对 关 
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系 的 支持 上 求 平 均 ， 我 们 仍然 能 够 估计 A 和 6565， 与 上 面相 似 的 常量 。 这 样 得 到 下 面 的 改进 


RZ ? 
> Zy ul 
A, 一 xzEUD (5. 24) 
As UG] 


B 2) Zizu 
b, = TUG.DTI (5. 25) 

EKER, UG, DÆI Mi ; ML 评分 的 用 户 的 集合 。 

这 仍然 不 能 够 克服 稀 朴 问题 。A; 或 5; 的 元 素 可 能 会 因为 被 用 于 计算 平均 值 的 用 户 组 
的 排序 而 改变 。 正 如 之 前 讨论 的 那样 ， 基 于 相对 低 支持 度 (|U(;, 7) | 的 值 较 小 ) 的 均值 
可 以 通过 收缩 到 一 个 共同 值 来 改进 。 尤 其 是 ， 我 们 计算 一 个 基准 值 ， 该 基准 值 是 通过 所 有 
可 能 的 A, 的 值 的 平均 值 来 定义 的 。 定 义 这 个 基准 值 为 avg， 它 的 精确 定义 在 5. 4. 3. 2 节 中 
描述 。 于 是 ， 定 义 相应 的 &XA 和 矩阵 A 和 向 量 5E R : 


a = IUG, D|. Ay +B + avg (5. 26) 


j UG. DIFE 


A _ |UG.j)|+ b; +g. avg (5. 27) 
b; [UGA +B 


参数 8 控制 了 收缩 的 程度 。 一 个 典型 的 取 值 为 6 一 500。 

假设 A 和 2 的 最 佳 估计 值 分 别 为 A 和 8。 因此 ， 修 改 式 (5. 21) 以 便 将 插值 权重 定义 为 
下 面 线性 方程 组 的 解 

Áw-—b (5. 28) 

得 到 的 插值 权重 在 式 (5. 19) 中 使 用 以 预测 rao 

这 个 方法 解决 了 5.4.2 节 提 出 的 四 个 问题 。 第 一 ， 插 值 权 重 直接 从 评分 中 推导 得 到 ， 
而 不 是 基于 任何 相似 度 度量 。 第 二 ， 插 值 权重 公式 显 式 地 考虑 了 近邻 之 间 的 联系 。 第 三 ， 
权重 的 和 并 没有 被 约束 为 1。 如 果 一 个 用 户 ( 或 物品 ) 的 近邻 信息 很 少 ， 则 估计 权重 会 很 小 。 
第 四 ， 该 方法 随 着 物品 的 均值 或 方差 的 变化 自动 地 调整 。 
5.4.3.2 计算 时 的 问题 

基于 物品 的 邻 域 方 法 的 有 效 计 算 需 要 提前 计算 与 每 个 物品 对 相关 的 特定 值 ， 这 样 可 以 
达到 快速 检索 的 目的 。 首 先 ， 我 们 需要 通过 5. 4. 1 节 解 释 的 那样 提前 计算 所 有 的 s; 的 值 ， 
从 而 快速 访问 到 所 有 的 基于 物品 的 相似 度 。 

其 次 ， 我 们 提前 计算 A 和 5 的 所 有 项 。 为 了 达到 这 个 目的 ， 对 于 每 两 个 物品 i Mj, 
HA: 

23 5; 
Ay = SUG] 

然后 ， 前 面 提 到 的 式 (5. 26) 和 式 (5. 27) 中 的 基准 值 avg， 取 值 为 提前 计算 的 Xn 4g 
信 的 所 有 项 的 平均 值 。 事 实 上 ， 我 们 推荐 使 用 两 种 不 同 的 基准 值 ， 一 种 是 取 和 矩阵 信 的 非 对 
角 项 的 平均 值 ， 一 种 是 取 矩 阵 人 A 相 对 较 大 的 对 角 项 的 平均 值 ， 这 些 对 角 值 的 均值 之 所 以 较 
大 是 因为 它们 只 对 非 负 项 求 和 。 最 后 ， 使 用 ave 的 近似 值 ， 从 式 (5. 26) 所 示 的 矩阵 人 推导 


O “根据 前 面 所 述 的 top kM. —— PHE 
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出 一 个 完全 ?”Xz 矩阵 A。 这 里 ， 当 推导 人 的 非 对 角 项 时 ， 我 们 使 用 非 对 角 项 的 均值 ， 而 推 
导 A 的 对 角 项 时 ， 我 们 使 用 对 角 项 的 均值 。 

由 于 对 称 性 ， 我 们 只 存储 满足 >j 条 件 的 ss 和 A; 就 足够 了 。 经 验 表 明 ， 为 每 一 个 单 
独 的 值 申 请 一 个 字 节 就 已 经 足够 。 因 此 ， nn 个 物品 所 需要 的 总 空间 大 小 为 n(n 十 1) 字 节 。 

提前 计算 和 矩阵 A 的 所 有 可 能 的 项 节省 了 构建 A 不 确定 项 所 需要 的 元 长 时 间 。 快 速 检索 
入 中 的 相关 项 后 ， 我 们 可 以 通过 解决 式 (5. 28) 所 示 的 &X&k 方 程 组 系统 得 到 插值 权重 。 然 
而 ， 通 过 一 个 二 次 规划 [2] 把 这 限制 为 非 负 值 时 ， 预 测 准确 度 可 以 得 到 适度 提高 。 解 决 这 
个 方程 组 是 在 5. 4. 2 节 描 述 的 基于 邻 域 的 基本 方法 基础 上 增加 的 额外 花费 。 对 于 的 典型 
值 (20 一 50)， 额 外 的 时 间 花 费 与 计算 & 个 最 近 的 近邻 所 需要 的 时 间 相 当 。 因 此 ， 尽 管 与 之 
前 的 方法 相 比 ， 该 方法 依赖 于 对 插值 权重 进行 更 加 详细 的 计算 ， 但 是 并 没有 显著 增加 运行 
时 间 ， 参 见 文献 [2] 。 


5.4.4 总 结 


基于 邻 域 的 插值 的 协同 过 滤 算 法 或 许 是 创建 一 个 推荐 系统 最 流行 的 方式 。 三 个 主要 的 
组 成 部 分 描述 了 这 个 基于 邻 域 的 算法 的 特征 : 1) 数 据 规范 化 ; 2) 近邻 的 选择 ，3) 插 值 权 重 
的 决定 。 

规范 化 对 于 一 般 意义 上 的 协同 过 滤 算 法 是 至 关 重 要 的 ， 尤 其 是 对 于 相对 局 部 性 的 基于 
邻 域 的 方法 。 否 则 ， 即 使 再 复杂 的 方法 也 注定 会 失败 ， 因 为 它们 混合 了 不 兼容 的 评分 ， 而 
这 些 评 分 是 与 不 同 规范 化 的 用 户 或 者 物品 相关 的 。 我 们 基于 基准 预测 器 描述 一 种 合适 的 方 
法 来 进行 数据 规范 化 。 | 

邻 域 的 选择 是 另 一 个 重要 的 组 件 。 它 与 采用 的 相似 度 度量 直接 相关 。 这 里 强调 收缩 不 
可 靠 相似 度 的 重要 性 ， 目 的 是 避免 发 现 有 低 评分 支持 度 的 近邻 。 

最 后 ， 基 于 邻 域 的 方法 的 成 功 依赖 插值 权重 的 选择 ， 这 些 插值 权重 被 用 来 从 已 知 评分 
的 物品 的 近邻 物品 中 估计 未 知 的 评分 。 然 而 ， 大 多 数 已 知 的 方法 缺少 一 种 推导 出 这 些 权重 
的 严密 的 方法 。 我 们 证 明了 如 何 把 这 些 权 重 转 化 为 最 优化 问题 的 全 局 解 来 求解 ， 这 个 最 优 
化 问题 恰恰 反映 了 它们 的 角色 。 


5.5 增强 的 基于 邻 域 的 模型 


大 多 数 基 于 邻 域 的 模型 在 本 质 上 是 局 部 性 的 ， 因 为 它们 只 关注 相关 评分 记录 的 一 个 小 
的 子 集 。 这 与 矩阵 分 解 技术 是 相反 的 ， 和 矩阵 分 解 技术 尽量 从 全 局 的 角度 来 描述 物品 和 用 户 
的 特征 。 看 起 来 使 用 这 种 全 局 的 观点 可 以 提高 准确 性 ， 这 正 是 提出 本 节 中 方法 的 动机 。 我 
们 提出 一 个 新 的 基于 邻 域 的 模型 ， 该 模型 借鉴 了 传统 基于 邻 域 的 方法 和 和 矩阵 分 解 模 型 两 方 
面 的 原理 。 与 其 他 基于 邻 域 的 模型 一 样 ， 该 模型 的 基础 也 是 基于 物品 的 关系 (作为 另 一 种 
选择 ， 或 基于 用 户 的 关系 )， 这 些 关系 为 系统 提供 了 一 些 之 前 讨论 过 的 实际 优势 。 同 时 ， 
与 矩阵 分 解 技术 相似 ， 该 模型 是 以 一 个 全 局 优化 框架 为 中 心 的 ， 这 个 框架 通过 考虑 数据 中 
存在 的 许多 弱 信 号 来 提高 准确 度 。 

在 5. 5. 1 节 中 描述 的 主要 方法 允许 我 们 用 隐 式 反馈 数据 来 丰富 这 个 模型 。 除 此 之 外 ， 
这 个 主要 方法 提供 了 两 种 新 的 可 能 性 。 首 先是 在 5. 5. 2 节 讨论 的 因子 分 解 邻 域 模型 ， 该 模 
型 在 计算 效率 上 有 很 大 的 提高 。 其 次 是 对 时 间 效 应 的 处 理 ， 正 如 在 5. 5. 3 节 所 描述 的 那 
样 ， 这 样 做 提高 了 预测 准确 度 。 
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5.5.1 全 局 化 的 邻 域 模型 


本 节 引 入 基于 全 局 最 优化 的 邻 域 模型 。 该 模型 提供 了 在 5.4.3 节 中 描述 的 模型 的 优 

进而 提供 了 更 高 的 预测 准确 度 。 除 此 之 外 ， 该 模型 还 具有 额外 的 优点 ， 概 括 如 下 : 

。 不 依赖 任意 的 或 者 启发 式 的 基于 物品 的 相似 度 。 这 个 新 的 模型 饰演 的 是 一 个 全 局 
最 优化 问题 的 解 。 

。 固有 的 防止 过 拟 合 和 “风险 控制 的 能 力 : 该 模型 恢复 成 了 具有 健壮 性 的 基准 预测 
器 ， 除 非 一 个 用 户 输入 了 足够 多 的 相关 评分 。 

。 该 模型 可 以 捕获 包含 在 某 个 用 户 所 有 评分 记录 中 弱 信 号 的 总 量 ， 而 不 需要 只 关注 
最 相似 物品 的 几 条 评分 记录 。 

。 该 模型 天 生 人 允许 整合 不 同形 式 的 用 户 输 入 ， 如 显 式 反馈 和 隐 式 反馈 。 

。 可 以 以 线性 时 间 复 杂 度 和 空间 复杂 度 实 现 该 模型 的 高 度 可 扩展 性 ， 因 此 使 得 基于 
物品 的 和 基于 用 户 的 两 种 实现 在 非常 大 的 数据 集 上 有 很 好 的 可 扩展 性 。 

。 数据 随时 间 变 化 的 特点 能 够 被 整合 到 该 模型 中 ， 这 样 就 提高 了 预测 准确 性 ， 参 见 

; 5.5.9 7s 

5.5.1.1 建立 模型 
我 们 通过 不 断 修正 公式 来 逐步 构建 模型 的 各 个 组 成 部 分 。 之 前 的 模型 是 以 特定 用 户 的 

插值 权重 为 中 心 的 ， 也 就 是 式 (5. 19) 中 的 6; SURGE C. 17) 中 的 点 / D s; 。 为 了 方便 实 


jes'cu 
现 全 局 最 优化 ， 我 们 放弃 使 用 这 样 特定 用 户 的 权重 ， 而 是 使 用 与 特定 用 户 无 关 的 基于 物品 
的 权重 。 物 品 7 到 物品 i 的 权重 定义 为 w; ， 该 权重 从 数据 中 通过 最 优化 学 习 得 到 。 模 型 的 
初始 框架 通过 下 面 的 等 式 来 描述 评分 ra: 
fu = dat Dy Gu — byw 3 (5. 29) 


€RG) 


这 个 规则 以 原始 但 是 具有 健壮 性 的 基准 预测 器 (6 ) 开 始 。 然 后， 估计 值 通过 对 用 户 x 
的 所 有 评分 求 和 来 调整 。 

现在 考虑 插值 权重 。 通 常 基 于 邻 域 的 模型 中 的 权重 代表 了 插值 系数 ， 这 些 系数 把 未 知 
的 评分 和 已 知 的 评分 联系 起 来 。 这 里 采用 一 个 不 同 的 观点 ， 该 观点 允许 使 用 更 灵活 的 权 
重 。 我 们 不 再 把 权重 当 作 插值 系数 。 相 反 ， 我 们 把 权重 当 作 调整 或 者 补偿 的 一 部 分 ， 并 把 
它们 增加 到 基准 预测 器 中 。 这 样 权重 w; 代表 了 我 们 基于 观察 到 的 ry 值 来 提高 7 的 预测 值 
的 程度 。 对 于 两 个 相关 的 物品 和 7 ， 我 们 希望 wy 的 值 较 大 。 因 此 ， 任 何 时 候 如 果 一 个 用 
户 对 物品 7 的 评分 超过 预期 值 (rw 一 5 很 高 )， 我 们 将 通过 把 Cr, 一 5 w, 增加 到 基准 预测 
来 增加 用 户 对 物品 i 的 估计 值 。 相 类 似 ， 通 过 用 户 u 正好 按照 期 望 (r。, — 0, 接近 于 0) 评 分 
的 物品 i， 或 者 通过 对 物品 i 没有 预测 价值 Cw, 接近 于 0) 的 物品 ;， 我 们 的 估计 值 不 会 与 基 
准 值 偏离 得 太 多 。 

这 种 观点 提出 了 对 式 (5. 29) 的 几 种 增强 。 首 先 ， 我们 可 以 采用 二 元 的 用 户 输入 形式 ， 
这 种 形式 对 矩阵 分 解 模 型 很 有 益 。 也 就 是 说 ， 我 们 分 析 哪 些 物品 被 评分 ， 而 不 关注 具体 的 
评分 值 。 为 了 这 个 目的 ， 我 们 增加 另 一 组 权重 ， 重 写 式 (5. 29)， 如 下 所 示 : 


bt o [Cru —bj)w; +c; ] (5. 30) 


相 类 似 , :这 里 我 们 可 以 使 用 另 一 一 组 隐 式 反馈 N(Cz)， 例 如 ,用 户 租借 或 购买 的 物品 的 
合 ， 得 到 下 面 的 预测 规则 : 


A 
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fs = by + 2 (ry = b, wy F 2 Ci (5. 31) 


jE RG) J€ NG) 

与 由 很 相似 ，c 也 是 增加 到 基准 预测 器 的 补偿 量 。 对 于 两 个 物品 ; 和 7 ， 用 户 wu 对 物 
mj 的 隐 式 偏好 使 我 们 用 cj 来 调整 对 x 的 估计 值 。 当 由 物品 i 可 以 预测 物品 7 时 ，c 应 该 
很 大 。 

使 用 全 局 权重 ， 而 不 是 特定 用 户 的 插值 系数 ， 是 为 了 强调 缺失 值 的 影响 。 也 就 是 说 ， 
一 个 用 户 的 观点 不 仅 体现 在 他 评分 的 物品 ， 而 且 体现 在 他 没有 评分 的 物品 。 例 如 ， 假 设 一 
个 电影 评分 数据 集 显 示 ， 对 “怪物 史 莱 克 3? 评 分 高 的 用 户 也 会 对 “怪物 史 莱 克 1 一 2 评分 较 
高 。 这 将 会 建立 从 “怪物 史 菜 克 1 一 2 到 “怪物 史 莱 克 3” 的 高 权重 。 现 在 ， 如 果 一 个 用 户 根 
本 就 没 对 “怪物 史 莱 克 1~2” 评 分 ， 那 他 对 “怪物 史 莱 克 3” 的 评分 将 会 被 惩罚 ， 因 为 一 些 必 
需 的 权重 没 能 增加 到 总 和 中 。 

对 于 之 前 的 模型 式 (5. 17) 和 式 (5. 19)， 由 于 它们 从 集合 {rs 一 bs |7 € S'G; w)} 中 取 值 
ru 一 bw 来 进行 插值 ， 所 以 保持 bi 值 和 6 和 值 的 兼容 性 就 很 有 必要 了 。 然 而 ， 这 里 不 使 用 插 
值 ， 因 此 可 以 把 bi 和 6 的 定义 解 而 。 相 应 地 ， 一 个 更 加 一 般 化 的 预测 规则 是 = 十 


>) Gu 一 bw wy 十 cs。 常量 bs 代表 了 其 他 方法 对 rw 进行 的 预测 ， 如 隐语 义 模型 。 这 里 建 


j€ RG) 


议 使 用 下 面 的 预测 规则 ， 该 规则 工作 得 很 好 : 
fs = ud bob 2) [rs — by wy + co] S9, 82) 


JER) 


重要 的 是 ，b, 是 常量 ， 其 推导 过 程 如 5. 2.1 节 中 解释 的 那样 。 然 而 ，b。 Mo, 变 成 了 
Rw 和 ci 那样 来 优化 的 参数 。 
我 们 已 经 发 现 规 范 化 模型 中 的 和 是 很 有 益 的 ， 于 是 得 到 下 面 的 形式 : 
Pa = ptb bd (RWI >) [Gy — bw; +c] (5. 33) 


jE RG) 


常量 a Ed TRL A BE. — AE LE (6 R3 LU Ca = 00 x f 6 DER E VE Ar R 
(R) | 很 高 ) 的 用 户 的 预测 值 跟 基 准 预测 有 较 大 的 偏 置 。 另 一 方面 ， 一 个 完全 规范 化 的 
规则 消除 了 评分 记录 的 个 数 在 预测 值 与 基准 预测 的 偏 置 方面 的 影响 。 在 许多 情况 下 ， 对 于 
评分 记录 很 多 的 用 户 ， 让 他 们 的 预测 值 与 基准 预测 的 偏 置 较 大 对 于 推荐 系统 来 说 是 一 个 很 
好 的 尝试 。 这 种 情形 下 ， 对 那些 与 模型 吻合 得 很 好 且 提 供 了 很 多 输入 的 用 户 进行 预测 时 ， 
就 会 有 更 大 的 风险 。 对 于 这 样 的 用 户 ， 我 们 宁愿 给 出 诡异 且 不 常见 的 推荐 。 同 时 ， 我 们 不 
太 确 定 如 何 对 那些 只 提供 很 少 输入 的 用 户 建 模 ， 这 种 情形 下 ， 我 们 将 会 使 用 接近 基准 值 的 
保险 估计 值 。 在 Netflix 数据 集 上 的 经 验 表明 ， 当 a—0.5 时 ， 模 型 取得 最 好 的 结果 ， 也 就 
是 下 面 的 预测 规则 : 

Pa = pF b, bi | RGO IF >) [ors — by wy +c] (5. 34) 


jE R(u) 
作为 一 种 可 选 的 改进 ， 可 以 通过 剪 掉 那些 与 不 太 可 能 的 基于 物品 的 关联 相对 应 的 参数 
来 降低 模型 的 复杂 度 。 把 SG 定义 为 与 物品 ;最 相似 的 & 个 物品 的 集合 ， 该 集合 是 由 如 


相似 度 度量 s 或 与 物品 集 相关 联 的 自然 层次 决定 的 。 除 此 之 外 ， 定 义 R'(i; WERN 
St(i)9 。 现 在 ， 当 根据 规则 (5. 34) 来 预测 ~ 时 ， 我 们 期 望 影响 最 大 的 权重 能 够 跟 与 物品 i 


加 ”标记 说 明 : 在 其 他 邻 域 模型 最 好 采用 SCG zx) ， 表 示 用 户 评分 的 物品 中 ， 与 i 最 相似 的 k 个 物品 。 因 此 ， 
如 果 用 户 u 至 少 评分 了 k 个 物品 ， 我 们 将 总 会 有 |S u) | =k， 不管 那些 物品 与 i 有 多 相似 。 但 是 ， 
|R G; z | 通常 都 会 比 k 小 ， 因 为 有 些 和 i 最 相似 的 物品 没有 被 用 户 u 评分 。 


120 第 一 部 分 基础 技术 


相似 的 物品 关联 起 来 。 因 此 ， 用 下 面 的 预测 规则 来 替代 式 (5. 34): 
Pa = pth tbi + |R Gw) M) [oy — bow; +c] (5. 35) 


jER Gi) 


X k=oolkf, MIMICS. 34) 55x (5. 35) 是 一 致 的 。 然 而 ， 对 于 的 其 他 值 ， 模 型 (5. 35) 
提供 了 显著 减少 涉及 的 变量 的 可 能 性 。 
5.5.1.2 参数 估计 
预测 规则 (5. 35) 允 许 我 们 快速 在 线 预 测 。 在 需要 进行 参数 估计 的 预 处 理 阶段 ， 我 们 需 
要 做 更 多 的 计算 工作 。 这 个 新 的 基于 邻 域 的 模型 的 一 个 主要 设计 目标 是 使 高 效 的 全 局 最 优 
化 过 程 成 为 可 能 ， 而 这 正 是 之 前 基于 邻 域 的 模型 所 缺少 的 。 因 此 ， 模 型 的 参数 是 通过 解决 
与 式 (5. 35) 相 关 的 正则 化 最 小 二 乘法 问题 学 习 得 到 的 : 
min Y! (ru -u—b —b, |R GWD D Gr — bow; te). 
5. We Ee (u, DER je RF Gyu) 
+ Aw (++ >) wi +c) (5. 36) 
je R' ci) 
这 个 凸 问题 的 最 优 解 可 以 通过 最 小 二 乘法 解 算 器 得 到 ， 最 小 二 乘法 解 算 器 是 标准 线 
性 代数 包 的 一 部 分 。 然 而 ， 我 们 发 现 通过 下 面 的 随机 梯度 下 降 算 法 可 以 更 快 地 得 到 答 
案 。 我 们 定义 准确 性 误差 e。 ， 其 中 ，e 二 rs 一 7 。 我 们 对 集合 & 中 所 有 已 知 的 评分 记录 
做 循环 。 对 于 一 个 给 定 的 训练 案例 r;s， 我 们 通过 朝 着 与 梯度 相反 的 方向 移动 来 修正 参 
数 ， 如 下 所 示 : 
* b, <b, -- y * Ceu — Ài * bu) 
* b; «— b; +7 * Cea — Ào * bi) 
。 Yj E€ R'G;wu: 
wy 4 wi Hye (|R Gu) |7? * es * Guy — by) — Xo * wy) 
cj «cy tye (|R'G;u) |^? * ej — Ato * Cj) 
元 参数 yY( 步 长 ) 和 io 由 交叉 验证 决定 。 在 Netflix 数据 中 ， 我 们 使 用 y—0.005, Av = 
0. 002， 另 一 个 重要 参数 是 上 ， 该 参数 控制 了 邻 域 的 大 小 。 经 验 表明 随 着 & 的 增 大 ， 我 们 在 
测试 集 上 得 到 的 结果 的 准确 性 也 随 之 提高 。 因 此 ，& 的 选择 反映 了 预测 准确 性 和 计算 代价 
之 间 的 一 种 权衡 。 在 5. 5. 2 节 中 ， 我 们 将 会 介绍 该 模型 的 因子 化 版 本 ， 该 版 本 允许 我 们 在 
& 一 co 条件 下 工作 ， 因 此 我 们 能 得 到 最 准确 的 结果 ， 同 时 又 降低 了 运行 时 间 。 
在 训练 数据 上 的 循环 次 数 的 典型 值 是 15 一 20。 至 于 每 次 迭代 的 时 间 复 杂 度 ， 我 们 
分 析 的 k= om EME, ， 也 就 是 使 用 预测 规则 (5. 34) 的 情形 。 对 于 每 一 个 用 户 wu 和 物 
m i€ RGO, REEK (wy, c; |7E RC(u)}。 因 此 训练 阶段 的 总 体 时间 复 杂 度 为 


o(3IRGO I^). 


5.5.1.3 准确 性 比较 


图 5.1 展示 了 Netflix 数据 中 使 用 全 局 最 优化 邻 域 模型 (以 后 记 为 ,GlobalNgbr) 得 到 的 
实验 结果 。 我 们 在 参数 上 取 不 同 值 条件 下 研究 了 该 模型 。 带 正方 形 标记 的 实 黑 线 显 示 准 
确 性 随 & 的 增加 单调 增加 ， 由 于 根 均 方差 (RMSE) 从 当 & 王 250 时 的 0.9139 降低 到 当 
& 一 o 的 0.9002, (注意 Netflix 数据 包含 17 770 PHB, k= om 等 价 于 R=17 769.) WAT 
用 隐 式 反馈 来 重复 进行 该 实验 ， 也 就 是 说 ， 从 模型 中 去 掉 BR, HX 标记 的 实 黑 曲 
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线 描述 的 结果 显示 : 随 着 & 增 加 ， 估 计 准 确 性 会 显著 下 降 。 这 验证 了 把 隐 式 反馈 整合 到 
模型 的 价值 。 
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图 5.1 基于 邻 域 的 模型 的 比较 。 准 确 度 是 由 Netflix 测试 集 上 的 RMSE 来 度量 的 ， 因 此 RMSE 越 
小 ， 准 确 度 越 高 。 我 们 在 考虑 隐 式 反馈 和 不 考虑 隐 式 反馈 两 种 条 件 下 度量 全 局 化 的 优化 模 
型 (GlobalNgbzr) 的 准确 度 。RMSE 表现 为 变量 的 函数 ， 变 量 & 代 表 邻 域 大 小 。 另 两 种 模型 
的 准确 度 显示 为 两 条 平行 线 ， 我 们 为 每 一 种 模型 选择 一 个 最 优 的 邻 域 大 小 


为 了 对 比 ， 我 们 提供 两 种 之 前 描述 的 基于 邻 域 的 模型 的 结果 。 第 一 个 是 基于 相似 度 
的 邻 域 模型 (在 5. 4. 2 节 中 有 描述 ) ， 该 模型 是 文献 中 最 流行 的 方法 。 我 们 把 这 种 模型 记 
为 CorNgbr。 第 二 个 是 在 5.4.3 节 中 描述 的 一 个 更 加 准确 的 模型 ， 记 为 JointNgbr。 对 于 
这 两 种 模型 ， 我 们 试图 选择 最 优 的 参数 和 邻 域 大 小 。 对 于 模型 CorNgbr， 邻 域 大 小 取 
20; 对 于 模型 JointCorNgbr， 邻 域 大 小 取 50。 这 两 种 模型 的 结果 分 别 由 点 线 和 虚线 描 
述 。 显 然 流 行 的 CorNgbr 方 法 的 准确 度 比 其 他 基于 邻 域 的 模型 的 准确 度 显 著 要 低 。 相 
反 ， 与 JointNgbr FEAL, GlobalNgbr 方法 的 结果 更 加 准确 ， 只 要 的 值 至 少 是 500。 
注意 参数 的 值 (z 坐标 轴 ) 是 与 之 前 的 模型 是 不 相关 的 ， 因 为 这 些 模型 的 邻 域 的 概念 不 同 
使 得 邻 域 大 小 是 不 兼容 的 。 然 而 ， 我 们 观察 到 尽管 GlobalNgbr 模型 的 性 能 随 着 更 多 近邻 
的 加 入 而 不 断 提 高 ， 但 这 对 于 另外 两 种 模型 并 不 适用 。 对 于 CorNgbr 模型 和 JointNgbr 
模型 ， 它 们 的 性 能 在 邻 域 的 大 小 相对 较 小 时 取得 最 佳 值 ， 随 后 随 着 邻 域 的 大 小 的 增 大 而 
下 降 。 这 或 许可 以 通过 这 样 的 一 个 事实 来 解释 ， 即 在 GlobalNgbr 模型 中 ， 参 数 是 通过 一 
个 正式 的 优化 过 程 直接 从 数据 中 学 习 得 到 的 ， 在 该 优化 过 程 中 ， 参 数 越 多 ， 推 荐 结果 越 
有 效 。 

最 后 ， 我 们 考虑 运行 时 间 。 尽 管 之 前 基于 邻 域 的 模型 需要 非常 细微 的 预 处 理 ， 但 是 
JointNgbr 模型 [2] 却 需要 为 每 一 个 预测 解决 一 个 小 方程 组 问题 。 当 估计 参数 时 ， 这 个 新 模 
型 确实 涉及 预 处 理 。 然 而 ， 在 线 预测 可 以 通过 规则 (5. 35) 立 即 得 到 。 预 处 理 的 时 间 随 着 的 
增加 而 增 大 。 图 5. 2 显示 该 模型 Netflix 数据 上 和 迭代 一 次 所 需要 的 典型 运行 时 间 ， 该 时 间 
是 在 主 频 为 3. 4GHz、CPU 为 奔腾 4 的 单 处 理 器 上 测量 得 到 的 。 
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图 5.2 全 局 优化 的 基于 邻 域 的 模型 迭代 一 次 的 运行 时 间 ， 该 运行 时 间 是 参数 的 函数 


5.5.2 因 式 分 解 的 邻 域 模型 


在 5.5.1 节 中 ， 我 们 展示 了 一 个 更 加 准确 的 基于 邻 域 的 模型 ， 该 模型 是 基于 预测 规则 
(5. 34) 的 ， 并 且 其 训练 复杂 度 为 O( 2 IRGO |*) ， 空 间 复 杂 度 为 OCm 十 mn?)。(m 是 用 户 


的 个 数 ，n 是 物品 的 个 数 。 ) 我 们 可 以 通过 剪 掉 不 可 能 的 基于 物品 的 关联 来 简化 该 该 模型 ， 进 
而 改善 时 间 和 空间 复杂 度 。 简 化 程度 是 由 参数 kn 控制 的 ， 模 型 的 简化 降低 了 运行 时 间 
而 且 允 许 空 间 复杂 度 为 Om 十 nk)。 然 而 ， 随 着 变 小 ， 模 型 的 准确 性 也 随 之 下 降 。 除 此 
之 外 ， 模 型 的 简化 需要 依赖 一 个 外 部 的 非 自 然 的 相似 度 度量 ， 而 这 种 相似 度 度量 正 是 我 们 
想 避 免 的 。 因 此 ， 我 们 将 会 展示 如 何在 保留 完全 的 致密 规则 的 准确 度 的 条 件 的 同时 ， 显 著 
降低 时 间 和 空间 复杂 度 。 

5.5.2.1 把 基于 物品 的 关系 进行 因 式 分 解 


我 们 通过 把 物品 i 与 三 个 向 量 关联 起 来 从 而 把 基于 物品 的 关系 包含 到 模型 中 ;qi ，zi， 
y;€ R/, 通过 这 种 方式 ， 把 zw 限制 为 qizi。 相 类 似 ， 强制 cj = qi yj. 从 根本 上 讲 ， 这 些 
向 量 试图 把 物品 映射 到 一 个 了 维 隐语 义 空间 中 。 在 这 个 隐语 义 空间 中 ， 这 些 向 量 衡量 了 数 
据 的 各 方面 ， 这 些 方面 是 通过 从 数据 中 学 习 而 自动 揭示 的 。 通 过 把 上 面 的 等 式 代 人 模型 
(5. 34)， 我 们 得 到 下 面 的 预测 规则 : 


f; = ub, b; - |RGO |-* > [Gu — 5,0972; + qry;] (5. 37) 
jE RG) 
通过 下 面 等 价 的 规则 可 以 明显 提高 计算 效率 : 
Fa = pth ck bib (IROD BD) Gu — bz; +y) (5. 38) 


JER) 
注意 ， 预 测 规则 (5. 38) AMS (ROW | 7? E Gr 一 bw ) zj 十 y) 只 依赖 于 用 户 妈 ， 
与 物品 i 无关。 这 样 就 可 以 通过 一 个 高 效 的 方式 来 学 习 模 型 的 参数 。 与 往常 一 样 ， wise 
以 下 与 式 (5. 38) 相 关 的 平方 误差 函数 ， 
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min >) (ru —p—b,—b;— gr (IRCu) |77 M Gs by; +y;)) 


| ur. y. b, DER jE RG) 
十 Ma QE + lal + >) bas? + ysl?) (5. 39) 
JER) 


最 优化 过 程 是 通过 随机 梯度 下 降 算法 完成 的 ， 随 机 梯度 下 降 算法 可 以 用 下 面 的 伪 代 码 
描述 : 


LearnFactorizedNeighborhoodModel(Known ratings: rui, rank: f) 
% For each item i compute qi,xi,yi € Rf 

% which form a neighborhood model 

Const #/terations = 20, y = 0.002, À = 0.04 

% Gradient descent sweeps: 

for count ='1,...,#Iterations do 


% Compute the component independent of i: 

Pu - |RU) Ejenqo (ru; — buj)xj v; 

sum <0 

for all i € R(u) do 
fui ep +bu +bi +q} Pu 
Cui 4— rui — fui 
% Accumulate information for gradient steps on x;,yi: 
sum «— sum 十 eui : gi 
% Perform gradient step on qi, by, bi: 
qi — qi + Y: (Cui Pu — À qi) 
by — bu + Y: (eui — À - bu) 
bi c bit y: (eui — À : bi) 

for all i € R(u) do 
% Perform gradient step on xj: 
xi € xi +Y- (RGQO|73 - (rui — bu) sum — À -xi) 
% Perform gradient step on yi: 
Yi yk Y- (IRU)? - sum — Ay) 

return {qi,xi, yili =1 n} 





该 模型 的 时 间 复 杂 度 与 输入 呈 线 性 关系 ， 是 O(f。》) IRGOI) 。 该 模型 的 时 间 复 杂 


度 显著 优 于 非 因子 分 解 的 模型 ， 后 者 的 时 间 复 杂 度 为 O( 》) IR GO |*) 。 我 们 在 Netflix 数 


据 上 度量 该 模型 的 性 能 ， 参 见 表 5. 3。 我 们 可 以 使 用 更 多 的 因子 ( 增 大 了 ) 来 提高 准确 度 。 
然而 ， 如 果 因 子 的 个 数 超过 200， 准 确 度 几 乎 不 会 再 提高 ， 却 降低 了 运行 时 间 。 有 趣 的 是 ， 
如 果 该 模型 的 因子 个 数 超过 200(f 之 200)， 与 非 因子 分 解 的 模型 (一 c2) 相 比 ， 该 模型 提 
高 的 准确 度 几乎 可 以 忽略 。 此 外 ， 增 加 的 时 间 复 杂 度 通过 在 运行 时 间 上 的 区 别 体现 出 来 。 
例如 ， 因 子 个 数 200 的 非 因子 分 解 模型 (k= 二 2) 的 一 次 迭代 的 时 间 大 概 是 58 分 钟 。 另 
一 方面 ， 因 子 个 数 为 200 的 因子 分 解 模 型 迭代 一 次 的 时 间 为 14 分 钟 ， 同 时 几乎 不 降低 准 
确 度 。 


表 5.3 因子 分 解 的 基于 物品 的 邻 域 模型 的 性 能 。 因 子 个 数 超过 200 时 ， 该 模型 的 性 能 略 优 于 非 因 
子 分 解 模型 ， 非 因子 分 解 模型 的 运行 时 间 相 对 更 短 





iE [a] / 38 4X, 


因子 分 解 模型 的 最 有 利 的 地 方 在 于 它 降 低 了 空间 复杂 度 ， 该 模型 的 空间 复杂 度 为 
O(m 十 zaP) ， 与 输入 呈 线 性 关系 。 之 前 基于 邻 域 的 模型 需要 存储 物品 之 间 的 所 有 成 对 关系 ， 
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因此 其 空间 复杂 度 为 Om 十 w*)。 例 如 ， 对 于 包含 了 17770 部 电影 的 Netflix 数据 集 ， 这 样 
的 平方 数量 级 空间 仍 能 够 放 到 主 存 中 。 一 些 商用 推荐 系统 会 处 理 更 多 的 物品 。 例 如 ， 像 
Netflix 这 样 提供 在 线 租赁 业务 的 服务 目前 拥有 超过 100 000 个 主题 。 音 乐 下 载 商铺 甚至 会 
有 更 多 的 主题 。 这 样 拥 有 100 000 个 物品 的 更 加 综合 性 的 系统 最 终 会 需要 借助 外 排序 来 处 
理 所 有 成 对 关系 的 集合 。 然 而 ， 随 着 物品 的 数量 增长 到 百 万 级 别 [20]， 如 Amazon 的 基于 
物品 的 推荐 系统 ， 设 计 者 必须 保留 成 对 关系 的 一 个 简化 版 本 。 为 了 达到 这 个 目的 ， 只 存储 
某 件 物品 的 top- 近邻 的 评分 ， 这 样 就 把 空间 复杂 度 降 低 到 OCm 十 次 ) 。 然 而 ， 这 样 的 简 
化 技术 将 不 可 避免 地 降低 准确 度 ， 原 因 是 该 技术 缺失 了 重要 的 关系 ， 这 一 点 在 之 前 的 章节 
中 就 说 明 过 。 除 此 之 外 ， 在 一 个 高 维 空间 中 找到 top- 最 近邻 并 非 易 事 ， 它 需要 相当 大 的 
计算 代价 。 所 有 的 这 些 问 题 在 因子 分 解 邻 域 模 型 中 都 没有 出 现 ， 该 模型 在 不 损失 准确 度 的 
条 件 下 提供 了 一 个 线性 的 时 间 和 空间 复杂 度 。 

因子 分 解 邻 域 模型 与 某 些 隐语 义 模型 很 像 。 这 里 重要 的 区 别 是 我 们 是 对 物品 一 物品 关 
系 进 行 了 因 式 分 解 ， 而 不 是 评分 本 身 。 表 5. 3 报告 的 结果 与 广泛 使 用 的 SVD 模型 旗 鼓 相 
当 ， 但 却 不 如 SVD 十 十 模型 的 结果 ， 参 见 5. 3 节 。 然 而 ， 该 因子 分 解 的 邻 域 模 型 保留 了 之 
前 讨论 的 传统 邻 域 模型 的 实用 优点 ， 即 解释 推荐 结果 和 立即 反映 新 评分 的 能 力 。 

作为 一 个 辅助 的 备注 ， 我 们 想 说 明 使 用 三 个 独立 的 因子 集合 的 目的 是 增加 灵活 性 。 确 
X, Æ Netflix 数据 集中 ， 这 样 做 让 我 们 得 到 了 最 准确 的 结果 。 然 而 ， 另 一 种 合理 的 选择 
是 使 用 小 规模 的 向 量 集合 ， 例 如 ， 可 以 令 q;— x (表示 权重 是 对 称 的 : wi 二 wi )。 
5.5.2.2 基于 用 户 的 模型 


基于 用 户 的 邻 域 模型 通过 考虑 志趣 相同 的 人 如 何 对 某 件 物品 的 评分 来 预测 该 物品 的 评 
分 。 这 样 的 模型 可 以 通过 在 基于 物品 的 模型 的 推导 过 程 中 变换 用 户 和 物品 的 角色 来 实现 。 
这 里 集中 讨论 基于 物品 的 模型 ， 该 模型 是 式 (5. 34) 所 示 的 基于 物品 的 模型 的 对 偶 形式 。 主 
要 的 区 别 是 我 们 用 关联 用 户 对 的 权重 来 代替 关联 物品 对 的 权重 wy : 


Pa = pth +6, HIRON E 》 Gu — bow, (5. 40) 


集合 尺 (DD) 包 含 了 对 物品 站 评分 的 所 有 用 户 。 注 意 这 里 决定 不 考虑 隐 式 反馈 。 这 是 因为 
增加 这 样 的 反馈 对 于 工作 在 Netflix 数据 上 的 基于 用 户 的 模型 不 是 很 有 利 。 

基于 用 户 的 模型 在 多 种 场景 中 都 很 有 有 用。 例如， 一 些 推荐 系统 或 许 会 处 理会 被 迅速 替 
换 的 物品 ， 因 此 基于 物品 的 关联 变 得 很 不 稳定 。 另 一 方面 ， 一 个 稳定 的 用 户 群 会 建立 物品 
之 间 的 长 期 的 关系 。 这 种 场景 的 一 个 例子 是 对 Web 文章 和 新 物品 的 推荐 系统 ， 这 些 Web 
文章 和 新 物品 在 本 质 上 是 不 断 变化 的 ， 参 见 文 献 [8]。 在 这 些 场景 中 ， 以 基于 用 户 的 关系 
为 中 心 的 系统 更 具 吸 引力 。 

除 此 之 外 ， 基 于 用 户 的 方法 能 够 识别 出 不 同 种 类 的 、 基 于 物品 的 方法 不 能 识别 的 关 
系 ， 因 此 该 方法 在 特定 场合 中 很 有 用 。 例 如 ， 假 设想 要 预测 r* ， 但 是 用 户 u 评分 的 物品 没 
有 一 个 是 真正 与 物品 i 相关 的 。 这 种 情形 下 ， 基 于 物品 的 方法 将 会 遇 到 明显 的 困难 .“ 然 
而 ， 当 使 用 一 个 基于 用 户 的 观点 时 ， 我 们 也 许 能 找到 与 对 物品 i 评分 的 用 户 u 相似 的 用 户 
的 集合 。 这 些 用 户 对 物品 i 的 评分 将 有 助 于 提高 rs 的 预测 准确 度 。 

基于 用 户 的 模型 的 最 大 缺点 体现 在 计算 效率 上 。 由 于 一 般 情况 下 用 户 的 数量 比 物品 的 
”数量 多 ， 所 以 提前 计算 并 存储 所 有 的 基于 用 户 的 关系 ， 甚 至 是 一 个 合理 的 简化 版 本 ， 都 需 
要 很 昂贵 的 代价 甚至 是 完全 不 切合 实际 的 。 除 了 高 达 OCm?) 的 空间 复杂 度 ， 优 化 模型 


式 (5.40) 的 时 间 复杂 度 也 比 基 于 物品 的 模型 的 时 间 复杂 度 要 高 ， 达 到 了 O( 3) RG I.) ( 注 
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&|RCG | 一 般 情况 下 比 |R(w) | 大 )。 这 些 问 题 使 得 基于 用 户 的 模型 在 实际 中 并 不 实用 。 
因子 分 解 模 型 。 当 沿 着 与 基于 物品 的 模型 相同 的 路 线 因子 分 解 基 于 用 户 的 模型 时 ， 所 
有 这 些 计算 式 的 区 别 都 不 存在 了 。 现 在 ， 我 们 把 每 一 个 用 户 与 两 个 向 量 pu, oz, 关联 起 来 。 
假设 基于 用 户 的 关系 结构 化 为 w,, 二 piz,。 把 上 面 的 等 式 代 入 式 (5. 40) 中 ， 得 
f. = ud b Fb - [RGF Y Gu — bu) pis, t. 000 


v€ RG) 


再 一 次 ， 我 们 通过 在 独立 的 总 值 中 引入 一 个 依赖 于 物品 i 而 与 用 户 u 无 关 的 项 来 提高 
计算 效率 。 因 此 预测 规则 如 下 所 示 : 
Pu = pth tot pl IRON? D) Gu — bz, (5. 42) 


v€ RG) 


在 基于 物品 的 模型 的 一 个 并 行 方式 中 ， 所 有 参数 都 可 以 在 线性 时 间 O( f - [RG | ) 内 


学 习 得 到 。 空 间 复 杂 度 也 与 输入 呈 线 性 增长 ， 为 O(n 十 mf)。 与 之 前 已 知 的 结果 相 比 ， 该 
并 行 方 式 显著 降低 了 基于 用 户 的 模型 的 复杂 度 ， 参 见 表 5. 4。 我 们 应 该 说 明 ， 与 基于 物品 
的 模型 不 同 ， 在 实现 基于 用 户 的 模型 时 没有 考虑 隐 式 反馈 ， 这 样 或 许 会 降低 运行 时 间 。 基 
于 用 户 的 模型 的 准确 度 显著 优 于 广泛 使 用 的 基于 关系 的 物品 间 模 型 的 准确 度 ， 正 如 图 5.1 
报告 的 那样 ， 该 模型 的 RMSE=0. 9406。 此 外 ， 准 确 度 略 优 于 基于 物品 的 模型 的 变种 ， 这 
个 变种 没有 考虑 隐 式 反馈 (图 5. 1 中 的 黄 线 所 示 )。 考 虑 到 基于 物品 的 方法 比 基 于 用 户 的 方 
法 更 加 准确 ， 这 个 结果 是 令 人 吃惊 的 。 看 起 来 如 果 一 个 基于 用 户 的 模型 实现 得 很 好 ， 其 速 
度 和 准确 度 能 够 比 得 上 基于 物品 的 模型 。 然 而 ， 如 果 考 虑 隐 式 反馈 ， 基 于 物品 的 模型 的 性 
能 可 以 显著 提高 。 


表 5.4 因 式 分 解 的 邻 域 模型 的 性 能 
a [= [ m [| œ | 


EMSE 0.9119 0.9101 0. 909 3 
Tn ii 


混合 基于 物品 的 模型 和 基于 用 户 的 模型 。 由 于 基于 物品 的 模型 和 基于 用 户 的 模型 解决 
了 数据 的 不 同方 面 的 问题 ， 总 体 准 确 度 可 以 通过 组 合 两 种 模型 的 预测 结果 来 提高 。 这 样 的 
方法 之 前 就 提 到 过 ， 并 且 证 明 可 以 提高 准确 度 ， 参 见 文献 L4，32]j。 然 而 ， 过 去 的 工作 是 
基于 在 后 处 理 阶段 混合 基于 物品 的 模型 和 基于 用 户 的 模型 的 预测 结果 ， 而 每 个 单独 的 模型 
在 训练 时 是 独立 于 其 他 模型 的 。 一 种 更 合理 的 方法 是 同时 训练 两 种 单独 的 模型 ， 使 它们 在 
学 习 参 数 时 就 能 相互 了 解 。 因 此 ， 在 整个 训练 阶段 每 个 模型 都 能 知道 另 一 种 模型 的 性 能 并 
尽力 来 补充 。 本 节 的 方法 认为 基于 邻 域 的 模型 等 价 于 一 个 形式 化 的 优化 问题 ， 因 此 可 以 自 
然 地 处 理 。 我 们 设计 一 个 模型 ， 该 模型 对 基于 物品 的 模型 (5. 37) 和 基于 用 户 的 模型 (5. 41) 
求 和 ， 如 下 所 示 : 

f, —u d b, Hbi - | RGO |-* >) [Gu —bu)giz; t aT ys] 


je€RG) 


+ [RG |? >) Ga — bu) plz, (5. 43) 


v€ RG) 


模型 参数 通过 对 相关 的 平方 误差 函数 进行 一 个 随机 化 梯度 下 降 来 学 习 得 到 。Netflix 
数据 上 的 实验 显示 预测 准确 度 确实 比 每 一 个 单独 的 模型 要 好 。 例 如 ， 当 因子 个 数 为 100 
时 ， 该 模型 的 RMSE 为 0. 8996; 当 因 子 个 数 为 200 时 ， 得 到 的 RMSE 为 0. 8953。 

这 里 ， 需 要 说 明 ， 我 们 的 方法 可 以 以 同样 的 方式 把 基于 邻 域 的 模型 和 完全 不 同 的 模型 
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集成 起 来 。 例 如 ， 在 文献 [17] 中 ， 我们 展示 了 一 种 集成 的 模型 ， 该 模型 把 基于 物品 的 模型 
和 隐语 义 模型 (SVD 十 十) 结合 起 来 ， 因 此 提高 了 预测 准确 度 ， 它 把 RMSE 降低 到 0. 887 
以 下 。 因 此 ， 在 考虑 整合 基于 物品 的 模型 和 基于 用 户 的 模型 时 ， 应 该 考虑 具有 潜在 的 更 好 
准确 度 的 可 能 性 。 


5.5.3 基于 邻 域 的 模型 的 动态 时 序 


基于 全 局 优化 (5. 5. 1 节 中 描述 的 ) 的 基于 物品 的 模型 的 优点 之 一 就 是 它 使 我 们 能 够 以 
一 种 合理 的 方式 捕获 时 间 效 应 。 正 如 我 们 之 前 说 明 的 那样 ， 用 户 偏好 随 着 时 间 而 变化 ， 因 
此 在 CF 模型 中 引入 时 序 方面 就 很 重要 了 。 

当 应 用 规则 (5. 34) 来 处 理 时 间 效应 时 ， 两 个 组 成 部 分 应 该 分 开 考 虑 。 第 一 部 分 ，/ 十 
bi 十 b,， 与 基准 预测 部 分 相对 应 。 典 型 意义 上 ， 这 个 部 分 解释 了 观察 到 的 信息 中 的 变化 性 。 
BARD, RD D) (rs 一 bw )ws 十 cs 捕获 了 信息 量 更 大 的 信息 ， 因 为 该 信息 处 理 
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了 用 户 一 物品 交互 信息 。 至 于 基准 部 分 ， 由 于 与 因子 模型 相 比 并 没有 变化 ， 所 以 根据 
式 (5. 6) 和 式 (5.9) 可 以 用 jy 十 b(ts) 十 b(t ) 代 蔡 。 然 而 ， 捕 获 交 互 部 分 内 时 间 效 应 需要 一 
个 不 同 的 策略 。 

基于 物品 的 权重 (rw 和 cj; ) 反 映 了 物品 的 固有 特点 ， 因 此 不 会 随时 间 变 化 。 学 习 过 程 
应 该 捕获 无 偏 的 长 期 值 ， 而 不 应 该 过 多 地 受 随时 间 变 化 的 方面 的 影响 。 实 际 上 ， 如 果 处 理 
不 当 ， 数 据 随时 间 变 化 的 本 性 将 掩盖 大 部 分 长 期 的 基于 物品 的 关系 。 例 如 ， 一 个 用 户 在 一 
个 时 间 周 期 内 同时 对 物品 i 和 j 给 予 了 很 高 的 评分 ， 这 将 是 这 两 个 物品 有 关联 的 一 个 很 好 
的 指示 ， 因 此 wi; 的 值 就 较 高 。 另 一 方面 ， 尽 管用 户 的 兴趣 (如 果 其 身份 不 变 ) 会 随 着 时 间 
改变 ， 如 果 那 两 个 评分 给 出 的 时 间 相 隔 了 5 年 ， 这 并 不 能 表明 这 两 个 物品 间 有 关系 。 此 
外 ， 我 们 认为 这 些 考 虑 几乎 是 依赖 用 户 的 ; 一 些 用 户 的 兴趣 比 其 他 用 户 更 加 一 致 ， 并 允许 
把 他 们 的 长 期 行为 关联 起 来 。 

我 们 的 目标 是 为 基于 物品 的 权重 提取 准确 值 ， 尽 管 有 时 间 效 应 的 影响 。 首 先 我 们 需要 
EAP u 评分 的 两 个 物品 之 间 的 不 断 衰弱 的 关联 参数 化 。 我 们 采用 函数 e wa FB SR AB 
衰减 ， 其 中 及 >>0， 该 参数 控制 了 特定 用 户 的 衰减 速度 并 从 数据 中 学 习 得 到 。 我 们 也 以 其 
他 衰减 形式 进行 试验 ， 比 如 ， 更 加 容易 计算 的 (1 十 8.Ab)-:， 使 用 该 衰减 形式 的 结果 具有 
相同 的 准确 度 ， 同 时 又 降低 了 运行 时 间 。 

这 样 就 可 以 得 到 下 面 的 预测 规则 : 

Pa = pF b: GU +b ta) + | RO) |77 Y) ete ew | (o — by wy fey) (5. 44) 


jER(u) 


涉及 的 参数 ， bi (ta ) =b; Fbi, pines) » bulta) =b, ras? dev, (tu) 十 De » Bus wy 和 cy Rf 
以 通过 最 小 化 相关 的 正则 化 平方 误差 学 习 得 到 : E 
2] Gu — p — bi — binna, — bu — a, * devu(tu) — bus, 


(Wi)EK 
— | RGO |^? b eter eu | C — by) wy +c;))? 
j€ RGo 
+ Anz (bi + Bi. sinc) T +a, TR + wi + c) (5. 45) 


最 小 化 过 程 是 通过 随机 梯度 下 降 完成 的 。 取 Xi — 0. 002， 步 长 (学 习 速率 ) 取 0. 005, 
并 选 代 该 过 程 25 次 。 一 个 例外 的 情况 是 在 更 新 B, 时 ， 我 们 使 用 一 个 很 小 的 步 长 10-*。 训 
练 时 间 复 杂 度 与 原始 算法 一 样 ， 为 O( 》) IR GO | ) 。 我 们 可 以 通过 简化 5.5.1 节 所 解释 
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的 基于 物品 的 关联 的 集合 来 在 复杂 度 和 准确 度 上 做 出 权衡 。 

与 因子 模型 相同 ， 在 基于 邻 域 的 模型 中 ， 适 当地 考虑 时 间 效 应 提高 了 在 电影 评分 数据 
中 的 准确 度 。RMSE 从 0. 9002[17] 降 低 到 0. 8885。 据 称 ， 这 显著 优 于 之 前 已 知 的 基于 邻 
域 的 方法 提供 的 结果 。 从 某 种 角度 看 ， 这 个 结果 甚至 比 使 用 混合 方法 (比如 ， 把 一 个 基于 
邻 域 的 方法 应 用 到 方法 L[2，23，31] 的 残 差 上 面 ) 报 告 的 结果 更 准确 。 我 们 得 到 的 一 个 经 验 ， 
是 : 与 设计 更 复杂 的 学 习 算 法 相 比 ， 考 虑 数据 中 的 时 间 效 应 能 够 对 预测 准确 度 有 更 大 的 
影响 。 . 

我 们 想 强调 一 个 有 趣 的 观点 。 假 设 x 是 一 个 用 户 ， 其 偏好 变化 得 很 快 (B, 很 大 ) 。 因 
此 ， 用 户 :之 前 的 评分 不 应 该 对 x 在 当前 时 刻 t 的 状态 有 很 大 的 影响 。 我 们 可 以 衰减 用 户 
u 之 前 评分 的 权重 ， 通 过 下 面 的 代价 函数 得 到 “实例 加 权 ”: 

DO ee lol Cra —p— bi — bise.) — bu — ad dev, Ct) 


(ui EK 


= bu, — |RGO|7* >) Cry = by wy +e) ) HaC) 


jE RG) 


这 样 的 函数 集中 在 用 户 在 时 刻 上 的 现状 ， 而 不 在 强调 用 户 之 前 的 行为 。 我 们 或 许 会 反 
对 这 个 选择 ， 而 是 选择 为 所 有 之 前 的 、 如 式 (5.45) 所 示 的 评分 的 预测 误差 赋予 同等 的 权 
重 ， 这 样 就 对 之 前 用 户 所 有 的 行为 进行 了 建 模 。 因 此 ， 同 等 权重 使 得 我 们 可 以 使 用 用 户 之 
前 的 每 一 个 评分 的 信息 ， 该 信息 被 提炼 成 基于 物品 的 权重 。 学 习 这 些 权重 将 会 同等 受益 于 
某 用 户 的 所 有 评分 。 也 就 是 说 ， 如 果 用 户 在 短 时 期 内 同时 对 两 个 物品 给 予 了 相似 的 评分 ， 
即使 这 是 很 久之 前 发 生 的 ， 我 们 仍然 可 以 推断 出 这 两 个 物品 是 有 关联 的 。 


5.5.4 总 结 


本 节 讲 述 了 一 个 非 传 统 的 基于 邻 域 的 模型 。 不 像 之 前 的 基于 邻 域 的 模型 ， 该 模型 是 基 
于 形式 化 的 优化 一 个 全 局 代价 函数 。 得 到 的 模型 不 再 是 局 部 化 的 了 ， 该 模型 考虑 了 一 个 由 
强 关 联 的 近邻 组 成 的 小 集合 之 间 的 关联 ， 而 没有 考虑 所 有 成 对 关系 。 这 样 可 以 提高 准确 
度 ， 同 时 又 保留 了 基于 邻 域 的 模型 的 一 些 优 点 ， 比 如 ， 预 测 结果 的 可 解释 性 和 在 不 用 重新 
训练 模型 的 情况 下 处 理 新 评分 (或 新 用 户 ) 的 能 力 。 

形式 化 的 优化 框架 提供 了 几 个 新 的 可 能 性 。 第 一 个 是 基于 邻 域 的 模型 的 因子 分 解 版 
本 ， 该 版 本 改善 了 计算 复杂 度 ， 同 时 保留 预测 准确 性 。 尤 其 是 ， 限 制 之 前 基于 邻 域 的 模型 
的 平方 级 别 的 存储 要 求 在 该 模型 中 也 消失 了 。 

第 二 个 是 把 时 间 效 应 整合 到 该 模型 中 。 为 了 揭示 物品 之 间 的 准确 关联 ， 我 们 提出 了 一 
个 模型 ， 该 模型 能 够 学 习 某 一 用 户 评分 的 两 个 物品 之 间 的 影响 是 如 何 随时 间 衰 减 的 。 与 矩 
阵 分 解 模型 很 类 似 ， 考 虑 时 间 效应 可 以 显著 提高 预测 准确 度 。 


5.6 基于 邻 域 的 模型 和 因子 分 解 模型 的 比较 


本 节 是 围绕 协同 过 滤 领 域 两 种 不 同 的 方法 组 织 的 : 因子 分 解 方法 和 基于 邻 域 的 方法 。 
每 一 种 方法 都 是 从 不 同 的 基本 原理 演进 过 来 的 ， 因 此 得 到 了 不 同 的 预测 规则 。 我 们 也 认为 
因子 分 解 模 型 能 够 得 到 更 准确 的 结果 ， 而 基于 邻 域 的 模型 有 一 些 实用 的 优点 。 本 节 将 会 证 
明 尽 管 有 这 些 区 别 ， 这 两 种 方法 还 是 有 很 多 相似 的 部 分 。 毕 竟 ， 它 们 都 是 线性 模型 。 

考虑 5.3.1 节 中 的 SVD 模型 。 该 模型 是 基于 下 面 等 式 的 : 

f.p. (5. 46) 
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为 了 渐变 ， 在 这 里 忽略 了 基准 预测 器 ， 但 是 我 们 可 以 很 容易 地 把 它们 重新 引入 该 模 
型 ， 或 仅 假设 它们 在 早期 阶段 从 所 有 评分 中 减 掉 了 。 
我 们 把 所 有 的 物品 因子 放 到 mox f MEQ, KP QSL, ges vs s TOR, 
我 们 把 所 有 的 用 户 因 子 放 到 nX f REP, Hop Pp pos o Pal o RAIH Xf 
矩阵 Q[za 来 定义 矩阵 QUE GFAP u WARRI, HEP n; | RCo) | 。 假 设 向 量 r 
含 了 用 户 u 的 评分 ， 该 评分 顺序 和 矩阵 QL[uj 中 的 评分 顺序 一 致 。 现 在 ， 对 用 户 u 的 所 有 
评分 使 用 式 (5. 46) ， 我 们 可 以 以 一 个 矩阵 的 形式 重新 定义 该 公式 : 
F, = Qlulp, (5. 47) 
给 定 QUu]. |r.—Qlulp.ll., CER BATE FCR SU] M : 
b. = (Qlu}’Qlu))"Qlu}"r, 
实际 上 ， 我 们 可 以 用 一 个 非 负 的 参数 4 来 正则 化 上 面 的 等 式 : 
pu = (Qlu J QUu] HAD Qu]? r, 
把 上 面 的 p, 代入 式 (5. 47), 18 
fa = QUu)(QQ[u]' Q[u] - AD 'Q(u]'r, (5. 48) 
可 以 引入 一 些 新 的 符号 来 简化 这 个 表达 式 。 我 们 把 fox f EEQ uT QLu]9AD "E 
MAW", GRABS AP u 相关 联 的 权重 矩阵 。 相 应 地 ， 从 用 户 的 角度 看 ， 物 品 i 和] 
之 间 加 权 的 相似 度 定义 为 中 一 qfW*“gj 。 使 用 这 种 符号 以 及 式 (5. 48), HIP! uum i 的 预 
测 偏好 在 SVD 模型 上 的 估计 值 如 下 : 
rs = b>. SGT uj (5. 49) 
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我 们 可 以 把 SVD 模型 简化 为 一 个 线性 模型 ， 该 线性 模型 把 用 户 的 偏好 预测 为 过 去 行 
为 的 函数 ， 并 由 基于 物品 的 相似 度 加 权 。 每 一 个 过 去 的 行为 都 会 有 一 个 独立 的 项 ， 这 些 项 
共同 形成 了 预测 值 和 名 。 这 与 基于 邻 域 的 基于 物品 的 模型 是 等 价 的 。 令 人 惊讶 的 是 ， 我 们 把 
矩阵 因子 分 解 模 型 转换 成 一 个 基于 物品 的 模型 ， 该 模型 具有 下 面 的 特征 : 

。 插值 是 从 用 户 过 去 的 所 有 评分 中 得 到 的 ， 而 不 仅 是 与 跟 当 前 物品 最 相似 的 物品 相 

关 的 评分 。 
。 关联 物品 i 和 j 的 权重 被 分 解 为 两 个 向 量 的 内 积 ， 一 个 向 晤 与 用 户 i 相关， 另 一 个 
向 量 与 物品 7 相关 。 

。 基于 物品 的 权重 与 特定 用 户 的 规范 化 有 关 ， 这 是 通过 矩阵 W" 实现 的 。 

这 些 特性 支持 了 我 们 在 如 何 最 好 地 构造 一 个 基于 邻 域 的 模型 方面 的 研究 成 果 。 首 先 ， 
我 们 在 5.5. 1 节 中 证 明了 当 邻 域 ( 由 参数 控制 ) 取 最 大 值 时 ， 基 于 邻 域 的 模型 取得 最 好 的 结 
果 。 因 为 当 邻 域 大 小 取 最 大 值 时 ， 过 去 用 户 所 有 的 评分 都 被 考虑 到 了 。 其 次 ， 在 5. 5. 2 节 
中 ， 我 们 尝试 了 因子 分 解 物品 -物品 权重 矩阵 。 至 于 特定 用 户 的 规范 化 ， 我 们 使 用 一 个 简 
单 的 规范 化 器 : n” o SVD 模型 可 能 会 使 用 W" 来 进行 更 加 基础 的 规范 化 ， 这 种 规范 化 工 
作 得 很 好 。 然 而 ， 实 际 中 计算 We 的 代价 很 昂贵 。 我 们 提出 的 基于 物品 的 模型 和 由 SVD 
模型 隐 式 推导 出 的 模型 间 的 另 一 个 区 别 是 ， 我 们 在 基于 用 户 的 模型 中 采用 非 对 称 的 权重 
(wy Fwy)» 而 SVD 模型 推导 的 模型 中 Si 77 Sj o 

在 上 面 的 推导 过 程 中 ， 我 们 展示 了 如 何 由 SVD 模型 推导 出 等 价 的 基于 物品 的 技术 。 
通过 把 ge 作为 评分 和 用 户 因子 的 函数 ， 我 们 可 以 以 一 种 完全 类 做 的 方法 推导 出 等 价 的 基 
于 用 户 的 技术 。 这 样 可 以 得 到 三 种 等 价 的 模型 ，SVD、 基 于 物品 的 模型 和 基于 用 户 的 模 
型 。 除 了 可 以 把 SVD 模型 和 基于 邻 域 的 模型 链接 在 一 起 ， 可 以 证 明 ， 只 要 设计 得 好 ， 基 
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于 用 户 的 方法 和 基于 物品 的 方法 是 等 价 的 。 

最 后 一 组 关系 (基于 用 户 和 基于 物品 之 间 的 关系 ) 也 可 以 直观 地 得 到 。 基 于 邻 域 的 模 
型 试图 通过 遵循 用 户 一 物品 邻接 链 而 把 用 户 和 新 物品 关联 起 来 。 这 样 的 邻接 代表 了 各 自 
用 户 和 物品 之 间 的 偏好 或 者 评分 关系 。 基 于 用 户 的 和 基于 物品 的 两 种 模型 恰好 是 遵循 相 
同 的 邻接 链 而 工作 的 。 它 们 的 区 别 仅 是 应 该 使 用 哪 一 种 “快捷 方式 ”来 加 速 计算 。 例 如 ， 
把 物品 B 推荐 给 用 户 1 时 会 参照 邻接 链 用 户 1 一 物品 A 一 用 户 2 一 物品 BC 用户 1 对 物品 
A 评分， 物品 A 又 被 用 户 2 评分， 用户 2 又 对 物品 B 评 分 )。 基 于 用 户 的 模型 遵循 了 这 
样 的 邻接 链 ， 并 提前 计算 了 基于 用 户 的 相似 度 。 通 过 这 种 方式 ， 该 模型 创建 了 一 个 “ 快 
捷 方 式 ”， 这 个 快捷 方式 绕 过 了 子 链 用 户 1 一 物品 B 一 用 户 2， 而 是 把 这 个 子 链 蔡 代 成 用 
P 1 和 用 户 2 之 间 的 相似 度 。 同 样 ， 基 于 物品 的 方法 恰好 也 遵循 了 相同 的 邻接 链 ， 但 是 
创建 了 另外 的 “快捷 方式 ”， 它 把 物品 A 一 用 户 2 一 物品 B 替换 成 物品 A 一 物品 B 之 间 的 
相似 度 。 

我 们 在 这 里 得 到 的 另 一 个 经 验 是 ， 把 基于 邻 域 的 模型 当 作 “基于 记忆 的 ”， 而 把 采用 矩 
阵 因 子 分 解 技 术 的 模型 以 及 爱好 当 作 “ 基 于 模型 的 ”并 不 总 是 恰当 的 ， 至 少 在 使 用 准确 的 基 
于 邻 域 的 模型 时 是 不 恰当 的 ， 因 为 这 些 模 型 差不多 与 SVD 一 样 都 是 基于 模型 的 。 事 实 上 ， 
另 一 个 方向 也 是 如 此 。 更 好 的 矩阵 分 解 模型 ， 如 SVD 十 十 模型 ， 也 是 基于 内 存 的 ， 因 为 在 
进行 在 线 预测 时 ， 它 们 对 内 存 中 存放 的 所 有 评分 求 和 ， 参 见 规则 (5. 3)。 因 此 ,“ 基 于 内 
存 ” 的 技术 和 “基于 模型 "的 技术 这 种 传统 的 分 类 方法 在 划分 本 章 考察 的 技术 时 并 不 合适 。 

目前 为 止 ， 我 们 集中 讨论 了 基于 邻 域 的 模型 和 矩阵 分 解 模型 之 间 的 关系 。 然 而 ， 实 际 
上 打破 这 些 关联 ， 并 用 区 别 足够 大 的 基于 邻 域 的 模型 来 增强 因子 分 解 模型 是 很 有 利 的 ， 因 
为 这 些 基 于 邻 域 的 模型 能 对 因子 分 解 模型 进行 很 好 的 补充 。 这 样 的 组 合 能 够 提高 预测 准确 
度 [3，17]。 达 到 这 个 目的 关键 是 使 用 更 加 本 地 化 的 基于 邻 域 的 模型 (使 用 5.4 节 中 的 模 
型 ， 而 不 是 5. 5 节 中 的 模型 )， 在 这 些 模型 中 ， 近 邻 的 个 数 是 有 限制 的 。 对 近邻 的 个 数 进 
行 限制 或 许 不 是 构造 单独 的 基于 邻 域 的 模型 的 最 好 方式 ， 但 是 该 方法 却 能 使 基于 邻 域 的 模 
型 和 因子 分 解 模型 有 足够 大 的 区 别 ， 这 样 做 的 目的 是 增加 一 种 局 部 性 的 观点 ， 而 这 种 观点 
正 是 全 局 化 的 因子 分 解 模型 所 欠缺 的 。 
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6.1 简介 


传统 的 推荐 方法 (基于 内 容 的 方法 [48] 和 协同 过 滤 方法 [40]) 适 用 于 推荐 特性 或 者 口味 
相似 的 产品 ， 如 书籍 、 电 影 或 者 新 闻 。 但 是 ， 在 推荐 一 些 如 汽车 、 电 脑 、 房 屋 或 者 理财 服 
务 的 产品 的 情况 下 ， 这 些 推荐 方法 就 不 是 最 佳 的 方法 了 (也 可 参考 第 11 章 )。 例 如 ， 房 屋 
交易 并 不 是 很 频繁 ， 所 以 这 让 我 们 很 难 在 一 个 房屋 产品 上 收集 到 大 量 的 评分 信息 (而 协同 
推荐 算法 正 是 需要 这 些 评分 信息 ) 。 同 时 ， 获 得 推荐 的 用 户 不 会 对 这 些 基于 已 经 过 时 的 产 
品 偏好 的 推荐 满意 (基于 内 容 的 方法 正好 需要 利用 这 些 偏好 )。 

基于 知识 的 推荐 技术 利用 用 户 的 显 式 需 求 ， 以 及 产品 领域 的 深度 知识 来 计算 推荐 ， 并 
通过 这 两 种 方式 来 解决 上 述 问题 [11]。 这 些 系 统 高 度 重视 那些 不 是 通过 协同 过 滤 和 基于 内 
容 的 方法 得 到 的 知识 源 。 与 协同 过 滤 和 基于 内 容 的 方法 相 比 ， 基 于 知识 的 方法 没有 冷 启动 
问题 ， 因 为 在 每 一 次 推荐 的 会 话 中 ， 推 荐 的 需求 都 是 被 直接 引出 的 。 但 是 ， 凡 事 都 有 两 面 
性 。 基 于 知识 的 推荐 的 缺点 是 所 谓 的 知识 获取 障碍 ， 知 识 整 理工 程 师 需 要 花费 很 大 的 努力 
将 领域 专家 提供 的 知识 转化 为 规范 的 、 可 用 的 表达 形式 。 

具体 来 说 ， 基 于 知识 的 推荐 方法 可 以 分 为 两 种 ， 基 于 样 例 的 推荐 [3，4，36] 和 基于 约 
束 的 推荐 [11，13]。e 在 利用 已 有 知识 方面 ， 这 两 种 方法 是 很 相似 的 : 先 收集 用 户 需求 ， 
在 找 不 到 推荐 方案 的 情况 下 [12，13，43]， 自 动 修复 与 需求 的 不 一 致 性 ， 并 给 出 推荐 解 
释 。 两 种 方法 的 区 别 在 于 推荐 方案 是 如 何 被 计算 出 来 的 [11]。 基 于 样 例 的 方法 通过 相似 度 
的 基础 来 决定 推荐 结果 ， 而 基于 约束 的 方法 主要 利用 预先 定义 好 的 推荐 知识 库 ， 即 一 些 描 
述 用 户 需 求 以 及 与 这 些 需求 相关 的 产品 信息 特征 的 显 式 关联 规则 。 本 章 只 关注 基于 约束 的 
推荐 方法 的 大 概 内 容 。 至 于 详细 的 基于 样 例 的 推荐 方法 ， 请 读者 参考 [3，4，36]。 

一 个 基于 约束 的 推荐 系统 ( 见 文献 [16]) 的 推荐 知识 库 通常 定义 为 两 个 变量 的 集合 : 
CVe，Vproo) 和 三 个 不 同 的 约束 的 集合 :Cr Crs Coop) 。 这 些 变量 和 约束 就 是 约束 满足 
问题 的 主要 成 分 [54]。 一 个 约束 满足 问题 的 解 ， 包 括 了 具体 变量 的 实例 化 ， 例 如 ， 所 有 特 
定 的 约束 都 得 到 了 满足 ( 见 6. 4 节 )。 | 

客户 特性 : Ve 描述 了 客户 可 能 的 需求 ， 即 需求 就 是 客户 特性 的 实例 化 。 在 理财 服务 领域 
客户 是 否 愿 意 冒 风险 就 是 一 个 客户 的 特性 ， 冒 风险 意愿 为 低 表 示 了 客户 的 一 个 具体 需求 。 
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Gerhard Friedrich, University Klagenfurt e-mail; gerhard. friedrich@uni-klu. ac. at 
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Markus Zanker, University Klagenfurt e-mail; markus. zanker@uni-klu. ac. at 
BE. KE, WA HK: 严 强 ， 吴 亮 ， 郑 州 大 学 - 吴 宾 
O ”基于 效用 的 推荐 系统 也 经 常 被 归结 到 基于 知识 的 推荐 方法 的 类 别 下 ， 例 如 文献 [4]， 详 细 了 解 基 于 效用 的 推 
荐 系统 方法 请 参考 [4，13] 。 
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产品 特性 : Vanwop 描 述 了 一 个 给 定 产品 种 类 的 特性 。 例 如 ， 推 荐 的 投资 周期 、 产 品类 
型 、 产 品名 称 、 期 望 收 益 等 都 是 投资 产品 的 特征 。 

约束 : Cr 是 对 客户 需求 可 能 的 实例 化 的 系统 约束 。 例 如 ， 短 期 投资 就 和 高 风险 投资 
不 相 容 。 

过 滤 条 件 : Cr 定义 潜在 客户 需求 和 特定 产品 种 类 的 关系 。 例 如 ， 一 个 缺乏 理财 经 验 
的 客户 就 不 应 该 接受 高 风险 的 投资 产品 

产品 : WO» Coron 表示 产品 特性 在 可 多 午 范 围 内 的 实例 。Crros 代 表 了 析 取 范式 的 一 
该 eid o es od 


推荐 知识 库 (Ve， Vian Crs Crs Crop) 

Ves (kl: [专家 ， lini ids een enne enne nnne nnn nnn nn nnn nnns Je 专业 等 级 */ 
wr.: [4&, P, W]e —— PB /A PREY ARTA RIM */ 
id.: [短期 ， rs dons enne nenne nn nnn nsns P) BEBE HT He 
aw.: [是 ， 否 ] … eene enne nn nnn n /3 是 否 需 要 顾问 */ 
ds. [储蓄 ， sus. 股票 ， 基 金 ， oun eins 直接 搜索 的 产品 */ 
sl: [储蓄 ， a) ses ssd dtu dd guod eene f) ABE DUI HE BE DISTRI x/ 
av: (ft, A] ， ——-^«— "ZZ LZ": EMPIBOy Rom AY FA */ 
sh; [股票 基金 ， ji /x 高 风险 投资 类 型 x/} 


V prov = (name, : [文本 ] ——————M—M 6o 产品 名 x/ 


"Th. "a *1- ————— ene cas eues ef iom x/ 
bo [1..14] eres /x h "iH KC x/ 
inst,s. [文本 ] eene enne ， /x 财务 机 构 x/)} 


Cy — (CR; : wr. = hid. ARM, CR: kl. — Wr wr.zEW) 

C; — (CF: id, =i—-mniv,<3, CF,: id, — Mj mniv, Z3 A mniv, <6, 
CF;; id,— KMWj—mniv, Z6, CF,: wr.—1K&--ri,—1K, 

CF,: wr, — —>ri, = Vri, 7h, CFy: wr, —7W-ri,—-1&Vri,—'PVri,— mW, 
CF;: kl.=# Fri, AM, CFy: sl, ll name, = 二 储蓄 ， 

CF,: sl, =M —> name, = fWK 25) 


Cprop — (CPROD,; :. name, — fh # Ner, =3 ri, =k A mniv, =1 A inst, = 

CPROD ; name, = {KF Ner, —5 A ri, ='P A mniv, =5 A inst, =B; 

CPROD;; name, = 33 B. A er, =9 A ri, =H A mniv, — 10 A inst, — B) 4 

在 这 样 的 推荐 知识 库 上 ， 给 定 一 个 客户 需求 的 集合 ， 我 们 就 可 以 计算 推荐 结果 。 鉴 别 
出 一 个 满足 客户 的 需求 和 意愿 的 产品 集合 的 任务 ， 我 们 定义 为 推荐 任务 ( 见 定义 6.1) 。 
PANE) 一 个 推荐 问题 可 以 定义 为 一 个 约束 满足 问题 。(Ve，Vprop，CeUCrUCrU 
Cpror )， 其 中 Vc 是 一 个 表示 用 户 潜在 需求 的 变量 的 集合 ，Vpkon 是 描述 产品 特性 的 变量 的 
RE + Crop 是 描述 产品 实体 的 约束 的 集合 ，CR 是 一 个 表示 客户 需求 的 组 合 的 集合 ，Cr 
(又 称 过 滤 条 件 ) 是 描述 用 户 需 求 和 产品 特性 的 关系 的 约束 的 集合 ， 最 后 Cc 是 表示 客户 具 
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体 需 求 的 一 元 约束 的 集合 。 

基于 例 6. 1 中 的 推荐 知识 库 ， 一 个 推荐 任务 可 以 表示 为 C= (wr. =k, kl = 
新 手 ， id. 一 短期 ， 5 一 储蓄 ) 。 

基于 推荐 任务 的 定义 ， 现 在 可 以 介绍 一 个 推荐 系统 任务 的 解 ( 一 致 的 推荐 ) 的 表示 。 < 

GREP 对 于 一 个 推荐 任务 (Vc, Vprop，Cc UCeUCkUCpror)， 当 且 仅 当 Ce U Cr 
U Ck U Cpgoo 无 任何 冲突 时 ， 我 们 定义 Vc 和 Vprkop 中 的 变量 组 合 为 一 致 性 推荐 。 

对 于 例 6.1 中 的 知识 库 和 例 6.2 中 定义 的 客户 需求 ， 一 个 一 致 的 推荐 是 : 
kl 二 新 手 ，wr. 一 低 ，id, 二 短期 ，sl, =E, name, =E, er, =3, rip =Ù, mniv, = 
l, inst, =A. 4 

除了 推荐 知识 库 ， 我 们 还 需要 定义 接收 推荐 用 户 的 预期 行为 的 界面 接口 。 为 了 支持 直 
观 的 对 话 ， 一 个 推荐 界面 接口 必须 是 自 适 应 的 ( 见 第 三 部 分 ) 。 有 不 同 的 选择 方案 来 描述 用 
户 界 面 的 可 能 行为 。 例 如 ， 对 话 可 以 建 模 为 显 式 的 有 限 状态 机 模型 [20]， 或 者 可 以 构建 为 
更 加 灵活 的 形式 ， 让 用 户 自 己 选择 他 们 喜欢 的 有 趣 的 特性 L37] 。 

本 章 关注 第 一 种 : 直接 用 有 限 状态 机 的 模型 对 推荐 对 话 界 面 建 模 [20]。 状 态 之 间 的 传 
递 表示 为 在 用 户 输入 上 的 接受 标准 。 例 如 ， 一 个 CEN CN WOM 
专家 (AL 三 专家 ) 对 一 个 理财 服务 (arw. 王 和 否 ) 的 推荐 a Sama M 
结果 不 感 兴趣 ， 则 自动 跳 转 到 q, (支持 特定 技术 产 M 06 4 


品 特征 的 搜索 界面 )。 图 6.1 的 有 限 状 态 机 模型 描 Tu! " Zl 6 
述 了 一 个 理财 服务 推荐 应 用 的 用 户 的 可 能 行为 。 uu | 4-7 


本 章 的 剩余 部 分 组 成 如 下 : 6.2 节 概 括 开 发 


基于 知识 的 推荐 系统 的 知识 获取 的 概念 和 推荐 过 ”图 6. 1 推荐 用 户 界面 的 描述 ,一 个 简单 的 


理财 服务 的 推荐 流程 。 流 程 从 状态 


程 的 定义 ， 6.3 节 介 绍 在 一 个 推荐 对 话 里 ， 引导 qo 开始 ， 然后 ， 根据 用 户 的 知识 等 
和 积极 支持 用 户 的 主要 技术 ，6. 4 节 简 要 介绍 解 级 ， 跳 转 到 状态 qo 或 者 状态 a. 
决 推荐 任务 的 方法 ，6. 5 节 讨 论 基于 约束 的 推荐 待 推荐 的 物品 呈现 在 最 终 状 态 (9 、 
技术 的 成 功 应 用 ，6. 6 节 介绍 基于 约束 的 推荐 技 qi. o 中 的 一 个 ) 每 个 状态 9 都 有 


一 个 用 户 特 性 变量 (9i ) 来 表示 在 这 


术 的 未 来 研究 方向 ，6. 7 节 总 结 本 章 内 容 。 个 状态 下 ， 需 要 提 的 问题 


6.2 推荐 知识 库 的 开发 


在 商业 应 用 中 ， 能 够 对 知识 工程 师 和 领域 专家 在 开发 和 维护 推荐 应 用 时 提供 支持 ， 并 
因而 利于 尽 可 能 地 减 小 知识 获取 的 瓶颈 困难 的 技术 ， 是 成 功 应 用 基于 约束 的 推荐 技术 的 主 
要 前 提 。 因 为 领域 专家 编程 技能 有 限 ， 通 常 在 开发 和 维护 知识 库 的 问题 上 ， 知 识 工 程 师 和 
领域 专家 之 间 存 在 着 差异 [13]。 这 样 一 来 ， 领 域 专家 只 需 负责 提供 知识 规则 ， 而 不 需要 将 
其 形式 化 ， 并 将 其 转 为 成 一 种 可 执行 的 表达 方式 ( 即 推荐 知识 库 ) 。 

文献 [13] 中 介绍 的 CWAdvisor 环境 的 主要 目的 就 是 要 减少 上 面 提 到 的 知识 获取 的 瓶颈 : 
它 为 领域 专家 提供 支持 ， 实 现 了 知识 库 的 开发 和 维护 的 流程 自动 化 。 为 了 展示 其 如 何 工作 ， 
我 们 将 在 接 下 来 的 部 分 介绍 CWAdvisor 环境 的 部 件 。CWAdvisor 知识 获取 环境 (CWAdvisor 
Designer) 所 遵循 的 设计 原则 ， 对 知识 的 获取 和 维护 ， 起 到 了 至 关 重 要 的 作用 [8，13]。 

。 第 一 ， 快 速 原型 流程 支持 具体 性 原则 ， 在 这 样 的 原则 下 ， 用 户 可 以 快速 检查 对 文 

本 解释 、 产 品 特性 、 图 片 、 推 荐 过 程 定义 和 推荐 规则 的 修改 带 来 的 效果 。 这 样 的 
功能 通过 模块 化 的 形式 来 实现 ， 在 这 样 的 形式 下 ， 我 们 可 以 将 图 形 定义 的 模型 特 
性 直接 转换 为 可 执行 的 推荐 应 用 。 
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。 第 二 ， 所 有 的 信息 单元 的 改变 都 可 以 通过 图 形 表达 出 来 。 这 样 的 功能 允许 领域 专家 在 
缺乏 技术 背景 的 情况 下 ， 能 更 轻松 地 接受 和 使 用 知识 获取 环境 。 领域 专 家 从 编程 细节 
的 技术 困境 中 解放 出 来 ， 这 样 的 方法 遵循 了 将 应 用 逻辑 和 实现 细节 严格 分 离 的 原则 。 
。 第 三 ， 集 成 的 测试 和 调试 环境 遵循 了 立即 响应 的 原则 : 推荐 知识 库 和 推荐 过 程 中 
的 错误 定义 都 能 被 自动 地 检测 和 报告 (支持 终端 用 户 调试 ) 。 这 样 ， 知 识 库 就 被 结 
构 化 地 组 织 起 来 ， 直 到 所 有 满足 知识 库 的 测试 样 例 都 得 到 满足 ， 它 才 会 在 生产 环 
境 下 发 生 作 用 。 这 导致 的 一 个 直接 结果 是 ， 错 误 的 结果 被 特殊 处 理 ， 因 而 推荐 结 
果 的 可 靠 度 得 到 提升 。 
图 6. 2 提供 了 一 些 CW Advisor 推荐 开发 环境 的 主要 建 模 概 念 的 实例 L13]。 这 个 环境 
可 以 用 来 设计 推荐 的 知识 库 ( 参 考 例 6.2)， 即 客户 特性 (Vc)、 产 品 特性 (Vprop ) 、 约 束 
(CCR) 、 过 滤 条 件 (Cr)、 产品 种 类 (Cn ) 可 以 具 化 到 图 形 层面 上 。 图 6. 2 的 上 面部 分 展示 了 
过 滤 条 件 (Cr) 的 设计 界面 ， 下 面部 分 展示 了 面向 上 下 文 的 通用 性 约束 的 界面 。 图 6. 3 展示 
T CWAdvisor Process Designer 的 用 户 界面 。 这 些 组 件 使 得 推荐 流程 的 图 形 化 设计 变 为 可 
能 。 给 定 了 这 样 的 流程 定义 ， 推 荐 结果 就 能 自动 化 地 生成 ( 见 图 6. 4)。 
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图 6.2 CW Advisor 设计 环境 。 过 滤 条 件 和 完整 性 约束 都 能 在 上 下 文敏 感 的 编辑 环境 中 定义 
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图 6.3 CWAdvisor 设计 环境 。 推 荐 流程 可 以 在 图 形 化 的 层面 来 详细 说 明 并 且 能 够 自动 
地 转换 到 相应 的 可 执行 的 表达 形式 。 在 基础 的 基于 模型 的 识别 器 上 [20]， 错 误 
的 转换 条 件 能 自动 地 被 识别 


有 时 候 ， 推 荐 流程 是 错误 的 ， 例 如 ， 状 态 间 转 换 方 式 定义 不 恰当 的 情况 下 ,: 将 导致 一 
个 推荐 会 话 不 能 成 功 完 成 。 在 图 6. 1 中 ， 如 果 我 们 改变 转换 条 件 ， 将 cl : kl. — beginner W 
Hci: kl, —erpert, 缺乏 理财 服务 领域 相关 知识 的 用 户 将 不 会 被 引导 到 后 续 状 态 (9? 或 
q;)。 在 更 复杂 的 流程 定义 下 ， 人 工 识别 和 修复 这 样 的 错误 是 单调 乏味 的 工作 ， 并 且 容 易 
出 错 。 文献 [20j 介 绍 了 一 种 方法 ， 能 够 帮助 我 们 自动 地 识别 和 修复 这 样 的 错误 状态 。 这 个 
方法 的 概念 基础 是 基于 模型 的 诊断 方法 [20] ， 这 样 的 方法 有 利于 找 出 引发 错误 转移 的 条 件 
因素 的 最 小 集合 。 

除了 图 形 化 的 流程 定义 ，CWAdvisor 设计 器 支持 测试 样 例 的 自动 化 生成 (输入 包含 推 
荐 产品 的 序列 )[16]。 一 方面 ， 这 样 的 测试 样 例 能 用 于 回归 测试 ， 例如， 可 以 在 推荐 应 用 
投入 生产 环境 前 使 用 这 些 测 试用 例 进行 测试 。 另 一 方面 ， 测 试 样 例 能 用 于 推荐 知识 库 的 错 
误 调 试 (如 果 有 一 些 测试 样 例 不 能 得 到 满足 ) 和 错误 流程 定义 (如 当 推 荐 流程 卡 住 的 时 候 )。 

例 6.49 介 绍 了 推荐 知识 库 调试 的 基本 原则 [10，12，13，16」]， 对 推荐 过 程 定义 自动 
化 调试 有 兴趣 的 读者 可 以 参考 文献 [20]。 识 别 推荐 知识 库 错 误 的 一 个 典型 方法 就 是 用 一 个 
包含 了 一 系列 测试 样 例 的 测试 集 (e; EE) 进 行 测试 。 为 了 简单 起 见 ， 我 们 假设 领域 专家 只 


O ”简单 起 见 ， 这 里 省 略 了 Vprop Cr 和 Cprop 的 说 明 。 
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个 性 化 问题 





C Tam anew to this. 
C 1already know the basic terms 
C Lam the expert, 


Continue | 基于 文本 的 搜索 框 





图 6.4 交互 式 的 个 性 化 偏好 提取 示例 。 用 户 通过 回答 问题 来 指定 他 们 的 偏好 


提供 了 一 条 样 例 ，e : wr 三 高 人 rr. 宇 9%。 测 试 e U CR 的 结果 是 空 集 ， 因 为 e 和 CR 不 

一 致 。 更 详细 地 观察 例子 ， 我 们 可 以 发 现 CR: CR; 和 e 都 不 一 致 。CR: CR, 被 定义 为 

冲突 集 L33，45]， 我 们 只 需要 删除 其 中 一 个 元 素 就 可 以 解决 不 一 致 问题 。 冲 突 集 的 计算 可 

以 通过 文献 [33] 提 供 的 冲突 检测 算法 来 实现 ， 文 献 L[20] 详 细 介绍 了 冲突 问题 的 自动 解决 。 
错误 的 知识 推荐 库 (Ve， Vprop, Cr» Crs Cprop) 


Ve={rr.: [1~3%, 4~6%, 7~9%, en eem f /x 回报 率 x/ 
m, Ble PEA — e f "是 原意 承担 有 x/ 
ph [短期 ， 中 期 ， idi ——Ó———— /x 投资 时 长 x/) 


Ca — (CR; : wr 二 中 一 id. 关 短期 

CR;: wr, — fj id, — KH 

CR;: id.= 长 期 rr 一 4 只 一 6% V rr, — 796—994 
CR,: rr.>9%>wr.= 

CRs: rr.=7%~9%>wr. 天 低 ) 


V prov = { } Cr = { } Cprop = () < 

在 从 构建 理财 服务 [18]、 电 力 设 施 [13]、 电 子 旅游 [74] 等 领域 的 商业 项 目 中 得 到 的 经 
验 来 看 ， 以 上 提 到 的 原则 对 于 知识 获取 和 环境 维护 的 设计 起 到 了 至 关 重 要 的 作用 ， 文献 
[L10] 对 用 户 研究 发 现 ， 因 为 开发 、 测 试 、 调 试 等 工作 都 可 以 在 图 形 化 的 界面 里 完成 ， 这 大 
大 节约 了 用 户 的 时 间 。 从 理财 服务 领域 [18] 的 经 验 来 看 ， 最 初 的 知识 库 必须 要 领域 专家 和 
技术 专家 ( 即 知识 工程 师 ) 的 合作 配合 来 完成 。 在 那 之 后 ， 大 多 数 开 发 和 维护 工作 都 可 以 直 
接 由 领域 专家 来 完成 (例如 ， 更 新 产品 列表 、 修 改 约束 、 定 义 推荐 过 程 等 )。 
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6.3 推荐 过 程 中 的 用 户 导向 


基于 约束 的 推荐 系统 的 运行 建立 在 用 户 的 需求 和 愿望 能 明确 表述 的 前 提 下 ， 因 此 这 些 
与 用 户 需求 相关 的 知识 必须 在 推荐 系统 建立 之 前 就 得 提前 准备 好 。 对 于 这 样 的 需求 获取 过 
程 ， 它 的 实施 复杂 度 是 递增 的 。 通 用 的 办 法 包括 以 下 几 点 ， 
。 与 会 话 无 关 的 顾客 信息 : 用 户 确认 他 们 的 偏好 以 及 兴趣 设置 ， 例 如 ， 通 过 指定 他 
们 的 一 般 兴 趣 范围 ( 见 第 22 章 )。 这 是 一 个 在 门户 网 站 和 社交 平台 通用 的 办 法 。 

。 每 个 会 话 的 静态 填写 表格 : 每 当 顾 客 使 用 一 次 推荐 系统 时 ， 他 们 便 会 填写 一 个 静 
态 的 网 络 表 单 。 这 样 的 界面 很 容易 实现 ， 而 且 互 联网 用 户 也 非常 熟悉 这 样 的 界面 ， 
因此 它们 经 常 被 用 在 网 络 购物 的 搜索 之 中 。 

。 会 话 式 的 推荐 对 话 框 : 在 一 个 交互 式 的 对 话 中 ， 举 例 来 说 ， 基 于 “评判 > 的 [8]( 见 

第 13 章 )、“ 向 导 式 的 ”和 基于 表单 的 偏好 提取 的 对 话 [13]、 自 然 语言 交互 [59] 或 
者 这 些 技 术 的 整合 ， 推 荐 系统 不 断 地 收集 着 用 户 的 偏好 信息 。 

在 基于 约束 的 推荐 系统 的 上 下 文中 ， 尤 其 是 最 后 一 类 的 偏好 提取 扮演 着 非常 重要 的 角 
色 ， 而 且 也 将 是 本 章 讨论 的 重点 。 因 为 在 类 似 理财 服务 [L18]、 电 子 生活 消费 品 L25j 等 综合 
领域 中 ， 推 荐 建议 往往 会 给 予 推荐 系统 相互 作用 的 终端 用 户 带 来 显著 的 认 知 负担 。 因 此 ， 
为 了 确保 这 套 系统 能 为 广大 的 在 线 用 户 社区 所 使 用 ， 充 足 的 用 户 交 互 是 必 不 可 少 的 。 

当然 ， 在 用 户 自己 填写 的 个 人 资料 中 ， 这 些 静 态 信息 也 可 以 当 作 基 于 约束 的 推荐 系统 
的 输入 源 。 将 这 些 笼统 的 信息 (包括 详细 的 人 口 统 计 信 息 ) 整 合 人 推荐 系统 的 步骤 也 是 简单 
明确 的 。 然 而 在 很 多 情况 下 ， 这 样 的 信息 很 容易 是 不 明确 的 或 空 泛 的 ， 因 此 ， 对 一 个 基于 
详细 知识 的 推荐 过 程 而 言 ， 这 些 信 息 碎 片 的 实用 性 是 很 有 限 的 。 

基于 上 述 提 到 的 原因 ， 静 态 填 充 表格 在 某 些 应 用 上 的 表现 很 好 。 但 是 ， 在 知识 密集 型 
领域 ， 基 于 约束 的 推荐 系统 会 经 常生 成 ， 这 样 的 方法 可 能 会 过 于 简单 ， 尤 其 是 因为 在 线 用 
户 群 可 能 因 他 们 的 技术 背景 不 同 而 不 同 ， 因 此 ， 对 所 有 用 户 都 问 同一 套 问 题 或 者 都 在 同一 
技术 细节 的 水 准 上 ， 是 不 合适 的 [25] 。 

最 后 ， 在 本 章 中 依然 不 会 聚焦 于 自然 语言 交互 。 因 为 只 有 非常 少 的 例子 ， 如 文献 [59] 
中 ， 运 用 了 (作为 补充 的 ) 自 然 语言 推荐 系统 用 户 界面 。 尽 管 随 着 自然 语言 处 理 领 域 的 发 展 
和 虚拟 拟人 顾问 在 不 同 的 网 站 以 扩展 组 件 的 形式 出 现 ， 但 由 于 一 些 不 同 的 原因 ， 它 们 至 今 
几乎 没有 被 用 来 向 用 户 推荐 物品 。 首 先 ， 这 类 的 对 话 往往 是 用 户主 导 的 基于 约束 的 推荐 系 
统 会 经 常生 成 ， 例 如 ， 用 户 将 积极 主动 地 提出 问题 。 但 在 综合 领域 ， 尤 其 是 新 用 户 ， 无 法 
系统 地 提出 这 样 的 问题 ， 如 正确 的 中 期 投资 策略 。 其 次 ， 由 于 这 类 系统 能 够 进行 随意 的 会 
话 ， 它 们 的 知识 习 得 的 代价 是 相当 高 的 。 最 后 ， 终 端 用 户 在 交互 后 常常 把 更 多 的 智能 归功 
于 这 样 的 拟人 替身， 而 不 是 归功 于 伴随 有 使 他 们 失望 的 风险 的 系统 。 

评论 ”对 基于 知识 的 推荐 系统 ， 评 论 是 一 个 普遍 的 交互 方式 。 它 第 一 次 被 提出 是 在 文 
献 [6] 中 的 类 似 会 话 推荐 的 基于 案例 推理 (CBR) 的 上 下 文 场景 中 。 这 样 的 理念 是 为 了 展现 
每 件 商品 (实例 )， 例 如 ， 数 码 相机 或 理财 产品 ， 依 照 各 个 产品 的 评价 ， 对 产生 交互 的 用 户 
提供 反馈 。 例 如 ， 一 个 用 户 可 能 需要 一 个 “短期 投资 ”或 “ 低 风险 ”的 理财 产品 。 这 个 推荐 一 
核实 一 修正 的 闭环 不 断 地 重复 ， 直 到 期 望 得 到 的 物品 被 找到 。 需 要 注意 的 是 ， 尽 管 这 样 的 
模式 是 为 CBR 推荐 方式 9 而 开发 的 ， 它 仍然 能 被 运用 于 基于 约束 的 推荐 系统 ， 因 为 评价 能 


日 ”用 评论 后 续 实 例 的 方法 探索 数据 ， 这 种 想法 在 20 世纪 80 年 代 的 信息 检索 领域 [55] 已 经 被 提出 过 。 
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够 直接 被 转化 成 附加 约束 ， 从 而 在 某 些 特征 上 反映 出 用 户 的 方向 性 仿 好 。 

与 在 很 多 在 线 商 城 都 能 找到 的 详细 搜索 表单 相 比 ， 评 论 的 交互 方式 有 它 的 优势 ， 因 为 
它 能 够 支持 用 户 交互 式 地 搜索 商品 库 。 此 外 ， 这 种 通常 被 你 为 微调 整 的 方法 ， 对 于 新 用 户 
而 言 也 很 容易 理解 。 可 是 ， 开 发 一 个 评论 程序 ， 需 此 一 些 领域 知识 ， 如 用 户 反 馈 的 特征 
集 ， 适 当地 量化 属性 增 和 项， 或 者 枚 举 域 内 符合 则 辑 的 属性 上 顺序。 此外， 当 需 要 将 用 户 需 求 
肌 射 到 产品 特征 上 去 时 ， 顷 外 的 工作 最 也 是 不 可 扣 免 的 。 

基本 的 评价 图 表 后 来 也 扩展 为 支持 复合 评论 [44，52]， 即 在 一 个 交互 周期 内 ， 用 户 能 
对 多 个 特征 给 出 反馈 。 在 理财 服务 领域 ， 用 户 也 因此 只 需 一 步 就 能 找到 一 个 更 低 分 险 、 更 
长 投资 期 限 的 产品 ， 这 样 也 就 减少 了 所 需 的 交 五 周期 次 数 。 在 有 些 提 前 设计 的 复合 评论 
[6] 中 已 经 是 合理 的 初始 建议 的 同时 ， 在 [44] 中 也 提出 另 一 种 意见 ， 合 再 的 评论 应 该 是 被 
动态 决定 的 ， 且 应 取决 于 当前 用 户 的 类 日 容 间 中 删 余 的 物品 ， 尤 其 是 这 些 剩余 物品 的 变化 
差距 。 实 验 评测 结果 表明 ， 这 伴 的 复合 评价 能 带 助 我 们 显著 地 降低 所 需 的 交互 周期 次 数 ， 
从 而 使 下 个 交互 过 程 更 加 有 有效。 此外， 实验 还 形 明 ， 复 合 评论 (即使 被 限制 大 小 ， 用 户 仍 
然 能 理解 ) 也 能 帮助 用 户 理解 系统 产生 推荐 的 迎 匆 ， 

关于 评论 研究 的 最 新 进展 ， 人 包含 了 精致 的 可 视 化 办 而 的 作用 [62]、 卑 机 推荐 系统 中 的 
应 用 推荐 方法 [74]、 关 于 决策 精度 和 认 知 效果 评论 样式 的 评估 [20]。 

个 性 化 偏好 提取 对 话 ”在 基于 约 末 的 推荐 系统 中 ， 男 一 种 获取 用 户 愿 望 和 需求 的 形式 
依赖 于 明确 模式 化 并 自 适 应 地 偏好 提取 对 话 。 这 样 的 对 话 模 型 ， 可 以 直接 用 对 话 框 形式 
[2j] 表 示 ， 或 者 是 跟 CW Advisor 系统 中 一 样 用 有 限 状 态 自动 机 表示 [20，13]。 

在 之 后 的 系统 中 ， 在 推荐 结果 展示 之 前 ， 终 端 用 户 由 “虚拟 顾问 ”通过 一 系列 关于 特定 
需求 的 问题 来 引导 ， 见 图 6.4 中 的 会 话 样 例 。 与 静态 填充 表格 对 比 ， 这 套 问 题 集 是 个 性 化 
的 。 也 就 是 ， 根 据 当 前 的 场景 和 以 前 的 用 户 回 答 ， 系 统 会 提出 一 大 不 同 的 问题 集 ( 或 许 也 
用 了 一 种 不 同 的 专业 术语 或 非 专业 术语 [29])。 

在 CWAdvisor 系统 中 ， 用 户 界面 的 变化 是 通过 有 限 状 态 自 动机 建立 在 手动 设计 的 个 
性 化 规则 和 明确 的 对 话 模 型 之 上 的 ， 如 图 6.1 所 示 。 因 此 我 们 选择 了 一 种 方法 ， 作 为 网 站 
用 户 热 知 的 填充 表单 和 基于 自然 语言 处 理 方法 的 充分 自由 的 会 话 之 间 的 折 中 。 

从 技术 上 讲 ， 通 过 那些 常常 被 用 来 捕获 用 户 需求 的 约 东 变量， 在 图 6. 1 中 的 有 限 状 态 
机 的 项 点 以 则 和 辑 和 表达 式 表 示 。 通 过 面向 终端 用 户 的 图 形 流程 建 模 编 辑 回 ， 处 理会 话 和 个 性 
化 模型 的 过 程 由 CWAdvisor 系统 支持 。 在 运行 时 ， 这 个 架构 的 交互 处 理 组 件 收集 了 用 户 
的 输入 并 评估 转移 条 件 ， 以 便 决 定 如 何 继续 对 话 ， 更 多 信息 请 参考 [13]， 

除了 个 性 化 对 话 ， 其 他 在 内 容 、 交 互 、 星 现 等 方面 的 不 同 自 适应 形式 也 运用 在 系统 中 
[30]， 目 的 是 尽 可 能 好 地 支持 终端 用 户 的 偏好 抽取 和 对 话 解 释 的 功能 设计 。 

虽然 高 诬 动 态 的 和 自 适应 的 网 络 应 用 程序 在 易 用 性 和 用 户 体验 上 有 价值 ， 但 在 技术 实 
现 上 是 有 挑战 性 的 ,尤其 是 在 基于 约束 的 推荐 下 维护 有 这 种 弹性 的 用 户 界面 。 在 这 个 背景 
下 的 主要 问题 是 在 “模型 “浏览 界面 "和 自控 馆 辑 之 间 的 强 连 接 ， 例 如 ， 想 象 这 样 的 情形 ; 
对 话 模 型 需要 摊 和 人 一 个 新 的 问题 ( 变 最 )， 一 个 新 的 回答 建议 (新 的 变量 值 城 ;， 或 囚 个 对 话 
页 面 (新 的 对 话 状 态 机 )。 在 所 有 情况 下 ， 用 来 呈现 来 自 推荐 应 用 “界面 "的 网 页 ， 都 必须 做 
出 相应 的 改变 。 因 此 ，, 个 性 化 偏好 提取 工作 的 工具 包 ， 必 须 提供 至 少 部 分 自动 化 更 新 用 户 
界面 的 机 制 ， 在 CW Advisor 中 的 基于 模板 的 方法 的 详细 信息 请 参考 文献 [30]， 

处 理 无 法 实现 的 或 太 宽泛 的 用 户 需求 ”在 基于 约束 的 推荐 系统 中 ， 在 个 性 化 偏好 提取 
的 场景 下 开发 这 样 的 用 户 接口 不 是 唯一 的 挑战 性 难题 在 下 文中 ， 我 们 将 简 述 这 项 技术 在 
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实际 应 用 遇 到 的 其 他 难题 ( 见 第 15 章 和 第 16 章 ) 。 

在 基于 约束 的 推荐 系统 中 ， 常 常 遇 到 目录 中 没有 找到 满足 用 户 所 有 约束 条 件 的 物品 的 
场景 。 在 一 次 交互 式 推荐 系统 的 通信 中 ， 像 “ 没 找到 匹配 的 商品 ?这 样 的 信息 无 论 如 何 都 是 

受 欢迎 的 。 因 此 而 产生 的 问题 是 ， 如 何 处 理 这 样 的 情况 ， 即 在 许多 情况 下 至 少 最 初 依赖 

一 些 查 询 机 制 来 从 产品 目录 (范例 库 ) 中 检索 出 一 套 初 始 案 例 集 ， 它 同样 发 生 在 基于 CBR 
的 推荐 系统 中 。 一 个 在 基于 CBR 推荐 系统 的 场景 下 提出 的 可 行 处 理 方 法 是 基于 宽松 查询 
[39, 43, 47, 23, 27]. Æ CBR 推荐 系统 的 场景 下 ， 可 推荐 物品 集合 是 被 概念 化 地 存储 
在 一 个 数据 库 表单 里 ; 实例 检索 包含 了 发 送 一 个 ( 源 于 用 户 需 求 的 ) 联 合 查 询 Q 到 这 个 实例 
检索 中 的 过 程 。 然 后 宽松 查询 指向 寻找 一 个 原始 查询 Q 的 (最 大 ) 子 查询 Q ， 最 终 返 回 至 

一 个 物品 。 

一 般 的 查询 放宽 技术 也 能 应 用 到 基于 约束 的 推荐 系统 之 中 。 考 虑 例 6. 5( 改 编 自 L27])， 
4 个 物品 Crroo 的 目录 在 图 6. 5 中 以 表格 的 形式 展示 。 
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图 6.5 样 例 物品 目录 (金融 服务 ) 


查询 放宽 

为 了 样 例 的 清晰 度 和 简洁 度 ， 在 一 个 咨询 应 用 的 “专家 栏目 ”上 ， 假 设 顾 客 能 直接 指定 
想 要 投资 的 产品 特征 。 因 此 ， 相 应 的 客户 资产 集 Vc 包含 sl.( 投 资 类 型 )、ri.( 风 险 等 级 )、 
minimun _ retum.( 保 底 收益 值 ) 和 investment _ duration.( 预 期 投资 时 间 )。 在 这 个 样 例 中 ， 
过 滤 约 束 ( 条 件 ) 简 单 地 把 顾客 需求 从 C. 映射 到 物品 特征 ， 也 就 是 Cr 5 {CF : sl 二 sly， 


CF, : ri, —ri,, CF, * investment duration. Ziminv,, CF, : er,=minimum _ return.) 。 ik 
具体 的 顾客 需求 C. 变换 如 下 : (sLsingleshares, ri, — medium, investment _ duration, 
=3, minimun _ retum. =5}. < 


显而易见 ， 在 给 定 的 任务 中 ， 目 录 里 没有 任何 物品 ( 见 图 6. 5) 满 足 所 有 的 相关 约束 条 
件 。 当 遵循 “约束 放宽 ”原则 时 ， 当 前 的 目标 包含 了 寻找 一 个 推荐 系统 能 找到 的 符合 约束 条 
件 Cr 的 最 大 子 集 。 最 大 化 的 标准 则 是 选取 有 代表 性 的 ， 因 为 约束 条 件 直接 涉及 顾客 需求 ， 
也 就 是 说 ， 更 多 的 约束 条 件 被 保留 时 ， 就 会 有 更 好 的 补偿 物品 来 匹配 这 些 需求 。 

当 第 一 次 发 现 寻 找 Cr 确立 一 致 性 子 集 的 问题 看 起 来 并 不 是 那么 复杂 时 ， 在 实际 操作 
中 ， 计 算 效 率 却 变 成 了 瓶颈 。 给 定 一 个 包含 n 个 约束 条 件 的 基本 约束 ， 所 有 可 能 的 子 集 数 
是 2"。 由 于 现实 可 用 的 推荐 系统 不 得 不 并 行 服务 许多 用 户 ， 并 且 一 般 情况 下 可 接受 的 响应 
时 间 大 约 是 一 秒 ， 所 以 朴素 的 子 集 搜索 是 不 可 取 的 。 

为 了 解决 这 个 问题 ， 人 们 提出 了 各 种 不 同 的 技术 。 在 文献 [39] 中 ， 举 例 来 说 ， 在 CBR 
推荐 系统 中 ， 提 出 的 方法 是 一 个 从 失败 查询 中 恢复 的 增 量 混合 法 。 在 文献 [47] 中 ， 提 出 了 基 
于 手动 定义 特征 分 类 放宽 的 方法 ， 尽 管 它 的 不 完备 性 在 旅游 业 推荐 系统 中 已 被 证 明 是 一 个 有 
效 的 解决 方案 。 最 后 ， 在 文献 [27] 和 文献 [26] 中 ， 在 基于 约束 的 推荐 系统 中 ,已 经 开发 了 查 
询 放 宽 问题 的 完整 算法 集 。 这 些 算法 不 仅 支持 线性 时 间 ( 以 预 处 理 过 程 和 少量 增 量 内 存 需 求 
为 代价 ) 的 最 小 放宽 计算 ， 还 支持 导致 “至 少 N” 件 剩余 商品 的 放宽 计算 。 此 外 ， 交 互 式 的 、 
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增 量 查询 放宽 的 冲突 导向 算法 也 被 提 了 出 来 ， 它 使 用 了 最 新 的 冲突 检测 技术 [33] 。 

线性 时 间 约 束 放 宽 技术 的 主要 思想 简单 描述 如 下 。 代 替 了 尝试 约束 组 合 ， 它 单独 评估 
相关 约束 ， 并 给 每 一 个 约束 条 件 分 配 数 据 结 构 ， 同 时 商品 目录 的 清单 满足 这 些 约束 条 件 ， 
见 图 6. 6。 


BS BE eee INE 








图 6.6 单独 评估 子 查询 。 比 如 ， 在 假设 sl. = singleshares 的 情况 下 ， 过 滤 条 件 CF; 将 产品 pi 过 滤 


表格 可 以 理解 如 下 。 投 资 型 ( 单 股 ) 约 束 条 件 CF, 在 表格 第 一 行将 过 滤 掉 物品 pi 
和 ps. 

给 出 这 个 表格 后 我 们 能 轻松 地 断定 ， 给 定 Cr 集 的 约束 条 件 必定 是 不 严格 地 会 有 某 一 
物品 出 现在 结果 集中 ， 也 就 是 说 ， 与 约束 条 件 和 用 户 需 求 一 致 。 例 如 ， 为 了 让 po 出 现在 
结果 集中 ， 约 束 条 件 CF 和 CF; 必须 要 被 放宽 。 让 我 们 称 为 bi 的 “特定 商品 放宽 "。 来 自 
[27] 中 的 方法 的 主要 思想 是 ， 对 于 给 定 的 商品 Conon 的 所 有 “最 佳 ? 放 宽 ， 过 滤 条 件 Cr 和 给 
定 的 具体 需求 集 C. 必须 在 特定 商品 放宽 列表 之 中 。 因 此 ， 扫描 特 定 商品 放宽 的 集合 就 足 
够 了 ， 也 就 是 说 ， 在 这 个 阶段 中 并 不 需要 更 深层 次 的 约束 解决 步骤 。 

在 这 个 样 例 中 ， 因 为 只 有 用 户 的 一 个 需求 被 忽略 ， 所 以 当 放 宽 的 约束 条 件数 量 决定 最 
佳 选 择 时 ， ARCH, 的 放宽 是 最 优 的 。 其 他 所 有 的 放宽 要 求 至 少 忽 略 两 个 约束 条 件 ， 这 样 
才能 通过 统计 每 一 列 中 零 的 个 数 来 简单 地 决定 。 请 注意 ， 相 关 约 束 条 件 的 数量 只 是 可 行 的 
最 优化 准则 之 一 。 考 虑 每 个 用 户 的 附加 “妥协 成 本 ”的 最 优化 准则 ， 也 能 在 这 个 技术 基础 上 
应 用 ， 只 要 满足 损失 函数 值 是 根据 放宽 程度 而 单调 递增 的 。 

从 技术 上 讲 ， 特 定 商 品 放宽 的 计算 能 够 通过 位 运算 非常 高 效 地 完成 [27]。 此 外 ， 在 推 
荐 系统 的 初始 化 时 ， 也 能 先 预 处 理 部 分 计算 过 程 。 

对 于 无 法 实现 的 需求 提供 备 选 方案 ”在 一 些 应 用 领域 ， 自 动 化 的 或 交互 式 的 个 别 约束 
放宽 或 许 不 能 帮 用 户 摆 脱 他 的 需求 无 法 满足 时 的 情景 。 考 虑 这 样 的 情景 ， 比 如 ， 在 交互 式 
放宽 方案 中 ， 推 荐 算法 提出 一 系列 约束 备 选 方案 集 。 假 设 用 户 接 受 其 中 的 一 个 建议 ， 也 就 
是 说 ， 同 意 放 宽 与 Vc 的 两 个 变量 A 和 有 关 的 约束 条 件 。 然 而 ， 如 果 A MB 的 值 对 用 
户 而 言 是 重要 的 (或 强制 性 的 ) ， 则 之 后 将 会 把 不 同 的 约束 条 件 加 在 这 些 变量 之 上 。 但 是 ， 
这 些 新 值 会 再 次 导致 与 该 用 户 其 他 需求 的 不 一 致 性 。 最 终 这 可 能 导致 一 个 不 合理 的 情况 ， 
即 用 户 终止 尝试 不 同 的 取 值 但 也 得 不 到 明确 的 建议 ， 它 衡量 了 接收 一 个 一 致 性 推荐 建议 的 
价值 。 

总 的 来 说 ， 它 会 因此 而 变 得 让 用 户 满意 ， 设 想 系统 能 马上 为 A 和 B 的 新 值 提出 建议 ， 
当 这 个 用 户 的 其 他 需求 也 被 更 进一步 地 考虑 时 ， 保 留 在 结果 集 里 的 一 些 物 品 得 到 了 保证 。 

让 我 们 先 考虑 运用 在 [39，43，47] 中 的 基础 CBR 式样 案例 检索 问题 ， 在 这 里 约束 条 
件 被 直接 强加 于 物品 特征 之 上 。 这 个 案例 中 的 约束 条 件 应 该 是 {sz, = singleshares, ri, = 
medium, minv, <3, er,Z:5). Wb, RRRA H I T BIER. 

在 这 样 的 情况 下 ， 有 关 物 品类 目的 详细 信息 常常 被 用 来 计算 一 组 针对 可 供 选 择 的 约束 条 
件 ( 恢 复 ”) 个 体 特征 的 建议 。 基 于 这 个 信息 ， 系 统 能 够 一 一 代替 只 建议 用 户 放 宽 投 资 类 型 和 
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投资 持续 时 间 的 需求 一 一 告知 用 户 “ 即 使 单 股 需求 被 抛弃 ， 并 且 最 小 投资 持续 时 间 设 定 为 4?， 
也 能 找到 一 个 或 多 个 物品 。 因 此 ， 用 户 能 ( 非 有 效 地 ) 预 防 尝试 最 低 投 资 持续 时 间 。 

在 这 个 案例 中 ， 此 类 替代 值 的 计算 可 由 系统 通过 选择 一 个 放宽 的 替代 物 和 搜索 满足 剩 
余 约 束 条 件 的 商品 类 目 来 完成 。 投 资 持续 时 间 和 投资 类 型 的 取 值 (比如 ， 图 6. 5 中 物品 1 
的 值 ) 也 能 直接 被 选取 为 终端 用 户 的 建议 [19，14]。 

当 这 种 方法 看 起 来 既 直 观 又 简单 时 ， 在 实际 应 用 中 却 需要 处 理 如 下 问题 。 

。 可 用 备件 的 数量 。 在 实际 情况 下 ， 可 用 的 备件 替代 量 往往 是 非常 大 的 ， 因 为 每 一 

种 可 能 的 放宽 一 一 这 里 可 能 就 已 经 有 很 多 一 一 都 存在 着 各 式 各 样 的 解决 方案 。 在 
实践 中 ， 不管 怎 样 ， 终 端 用 户 无 法 接受 过 多 的 备 选 方案 。 因 此 ， 问题 转 换 成 了 如 
何 选 择 并 排序 这 些 修正 过 的 备 选 方 案 。 

。 修正 建议 的 大 小 /长 度 。 修 正 对 包含 超过 三 个 特征 蔡 代 值 的 建议 ， 也 不 容易 为 终端 
用 户 所 理解 。 

。 非 平凡 约束 的 计算 复杂 度 。 当 只 允许 简单 的 商品 特征 约束 条 件 时 ， 类 目 信 息 有 利 
于 制订 上 述 可 行 的 修正 方案 。 在 像 CWAdvisor 这 样 的 基于 约束 的 推荐 系统 中 ， 不 
管 怎样 ， 经 常 涉 及 定性 用 户 需 要 的 (技术 ) 产 品 特征 的 约束 定义 是 可 行 的 。 因 此 ， 
修正 的 建议 也 必须 与 用 户 需 求 相关 ， 这 意味 着 可 行 修正 备 选 方案 的 搜索 域 是 由 用 
户 相 关 的 变量 域 所 决定 的 。 此 外 ， 决 定 是 否 是 用 户 需 求 ( 也 就 是 ， 一 个 修正 蔡 换 
品 ) 的 特定 组 合 导致 的 非 空 解 集 ， 可 能 需要 高 代价 的 类 目 查 询 来 实现 。 

为 了 至 少 在 一 定 程度 上 定位 这 些 问 题 ， 在 理财 服务 应 用 中 ， 针 对 修正 建议 的 计算 ， 
CWAdvisor 系统 使 用 了 查询 放宽 组 合 、 不 同 的 启发 式 搜 索 以 及 额外 的 特定 领域 知识 相 结 
合 的 方法 [17]。 

运用 在 系统 中 的 这 种 方法 通过 修正 备 选 方案 的 有 界 查询 、 交 叉 放 宽 查询 。 合 适 的 放宽 
是 由 它们 的 技术 递增 顺序 决定 的 。 对 于 每 一 个 放宽 ， 修 正 备 选 方案 是 通过 改变 那些 包括 放 
宽 的 约束 变量 值 来 决定 的 。 备 选 方案 取 值 的 选择 ， 可 以 以 “近似 ”启发 式 搜索 为 导向 ， 它 是 
以 外 部 的 或 内 在 的 确切 顺序 为 基础 的 。 因 此 ， 例 如 ， 一 个 用 户 的 需求 为 “至 少 希望 收益 
5%”， 则 邻 域 值 “4%” 会 被 评估 ， 假 设 这 样 的 一 个 备 选 方案 对 终端 用 户 而 言 比 一 个 更 强 放 
宽 更 容易 接受 。 为 了 避免 太 多 的 相似 修正 建议 ， 算 法 以 几 个 临界 值 为 参数 ， 比 如 ， 决 定 一 
个 放宽 的 修正 次 数 ， 一 次 放宽 的 最 大 上 限 等 。 总 的 来 说 ， 在 理财 服务 领域 的 证 据 表 明 ， 这 
样 的 一 个 修正 特征 ， 即 使 它 是 基于 启发 式 的 、 作 为 缩短 所 需 对 话 长 度 的 一 种 方法 ， 也 得 到 
了 终端 用 户 的 高 度 认 可 。 

查询 紧缩 ”在 一 个 交互 式 推荐 系统 中 ， 除 了 结果 集中 没有 任何 物品 ， 结 果 集 中 有 太 多 
的 物品 也 不 是 令 人 满意 的 。 在 一 些 实际 的 应 用 中 ， 用 户 被 告知 “找到 了 太 多 物品 ”并 需要 指 
定 更 精确 的 搜索 约束 条 件 。 结 果 往 往 是 只 有 前 面 的 少数 结果 得 到 展示 (比如 ,为 了 避免 过 
长 的 页 面 加 载 时 间 ) 。 不 管 怎样 ， 这 样 的 选择 对 当前 用 户 而 言 不 是 最 理想 的 ， 因 为 这 样 的 
结果 往往 是 基于 类 目 词 条 字典 序 的 简单 排序 。 

为 了 在 这 种 情况 下 也 能 更 好 地 服务 用 户 ， 在 文献 [48] 中 ， 一 个 基于 CBR 推荐 系统 的 
交互 查询 管理 方法 被 提 了 出 来 ， 它 也 包含 了 “查询 紧缩 ”的 技术 。 被 提出 的 紧缩 算法 把 一 次 
输入 当 作 一 次 查询 Q 和 它 的 大 型 结果 集 ， 并 挑选 出 (根据 信息 理论 的 约束 条 件 和 信 方 法 ) 三 
个 特征 展现 给 用 户 ， 并 建议 用 户 尽 可 能 地 精炼 查询 条 件 。 

总 的 来 说 ， 对 于 在 旅游 推荐 系统 中 同时 使 用 了 查询 放宽 和 查询 紧缩 L50] 的 交互 查询 管 
理 的 评测 结果 ， 放 宽 特 征 得 到 了 终端 用 户 的 高 度 认 可 。 评 测 还 表明 ， 通 过 考虑 紧缩 功能 ， 
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对 于 有 能 力 自行 精炼 查询 条 件 的 终端 用 户 ， 查 询 紧 缩 并 不 是 那么 重要 。 因 此 ， 在 [41] 中 提 
出 了 一 个 不 同 的 特征 选取 方法 ， 它 同样 把 特征 流行 度 的 概率 模型 纳 人 考虑 之 中 。 评 估 表 
明 ， 在 特定 环境 下 [41] 的 方法 表现 更 优秀 ， 因 为 它 更 容易 被 终端 用 户 接受 并 作为 进一步 精 
炼 查询 条 件 的 方法 。 


6.4 计算 推荐 结果 


根据 我 们 对 于 一 个 推荐 任务 的 描述 ( 见 定义 1)， 我 们 现在 将 讨论 相应 问题 的 解决 方案 。 
一 个 典型 的 解决 推荐 任务 的 途径 是 约束 满足 算法 L54] 和 结合 数据 库 查 询 [46] 。 

约束 满足 ”约束 满足 问题 的 解决 方案 寄 希 望 于 使 用 结合 回溯 法 和 约束 传播 法 的 搜索 算 
法 基础 所 有 概念 的 基本 原理 会 在 下 文中 解释 。 

回溯 法 ”在 每 一 步 ， 回 湖 法 选择 一 个 变量 并 把 所 有 可 能 的 值 分 配给 这 个 变量 。 它 用 已 
分 配 的 和 已 定义 的 约束 集合 来 检查 分 配 的 相 容 性 。 如 果 当 前 变量 的 所 有 可 能 的 值 与 当前 的 
分 配 和 约束 条 件 都 不 一 致 ， 约 束 求 解 器 由 原 路 返回 ， 这 意味 着 之 前 遍历 的 变量 又 被 选中 了 
一 次 。 当 这 次 分 配 的 相 容 性 得 到 保证 时 ， 回 渊 算法 的 递归 过 程 开 始 执行 ， 同 时 下 一 个 变量 
被 选中 [54j]。 | 

约束 传播 法 ”纯粹 的 基于 回溯 法 搜索 的 主要 缺点 是 ， 即 使 不 存在 解 ， 部 分 “无 效 ” 的 搜 
索 域 也 会 被 多 次 搜索 。 为 了 使 约束 解决 过 程 更 加 高 效 ， 约 束 传播 技术 被 引入 。 这 些 技术 学 
试 着 修改 一 些 当 前 的 约束 满足 问题 ， 以 便 使 搜索 域 能 显著 缩小 。 这 种 方法 尝试 着 创建 一 个 
局 部 相 容 的 状态 ， 来 保证 多 组 变量 值 间 也 能 始终 相 容 。 上 述 改进 步骤 将 一 个 当前 的 约束 满 
足 问题 转变 成 等 价 的 问题 。 一 种 众所周知 的 本 地 相 容 类 型 是 弧 相 容 [54]， 即 对 于 两 个 变量 
XAY, 4YEX 中 没有 对 应 的 相 容 的 值 时 ，Y 的 定义 域 为 空 。 因 此 ， 弧 相 容 直接 被 定义 
A, WR XX 与 Y 是 一 致 的 ， 反 转 后 未 必 是 一 致 的 。 

当 使 用 约束 求解 器 时 ， 约 束 被 典型 地 描述 为 对 应 编程 语言 的 表达 形式 。 目 前 许多 的 约 
束 求解 器 是 在 java 的 基础 上 实现 的 。( 样 例 可 参考 jacop. osolpro. com.) 

联合 数据 库 查询 ”联合 查询 的 解决 方案 是 在 数据 库 查询 的 基础 上 计算 的 ， 它 设法 检索 
出 满足 顾客 所 有 需求 的 物品 。 有 关 数 据 库 技术 和 数据 库 表单 查询 执行 的 详细 信息 ， 请 参考 
文献 [46] 。 

排序 物品 ”给 定 一 个 推荐 任务 ， 约 束 求解 器 和 数据 库 引擎 都 设法 确定 满足 顾客 给 定 需 
求 的 物品 集 。 一 般 情况 下 ， 我 们 需要 处 理 不 止 一 个 物品 是 推荐 结果 的 一 部 分 的 情况 。 在 这 
样 的 情况 下 ， 物 品 (商品 ) 需 要 在 结果 集中 排序 。 在 两 个 案例 (约束 求解 器 和 数据 库 引 擎 ) 
中 ， 我 们 应 用 多 属性 效用 理论 (MAUT[56]) 的 概念 来 辅助 确定 结果 集中 每 个 物品 的 排名 。 
MAUT 的 应 用 样 例 可 参考 文献 [13]。 

可 选择 的 与 联合 查询 结合 的 MAUT 应 用 是 概率 数据 库 [35]， 它 允许 在 查询 中 直接 指 
定 排序 标准 。 例 6.6 展示 了 这 样 的 一 个 查询 ， 它 通过 WHERE 子 句 挑选 出 那些 满足 标准 
的 商品 ， 并 按照 相似 性 (在 ORDER BY 子 句 中 定义 ) 排 序 。 最 终 ， 取 代 了 用 MAUT 结合 
上 述 标准 的 约束 求解 器 ， 我 们 以 软 约束 的 形式 表述 一 个 推荐 任务 ， 变 量 的 每 一 种 组 合 的 重 
要 性 (优先 级 ) 是 在 相应 通用 操作 (细节 请 见 文献 [1]) 的 基础 上 决定 的 。 

概率 数据 库 的 查询 

Result 一 SELECT * /x 计算 一 个 结果 x/ 

FROM Products /* 从 “Products” 中 选 出 物品 */ 

WHERE zx, =a; and z; =a; /x“ 必 须 ” 条 件 x*/ 
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ORDER BY score(abs(x;—a;), °**, abs(x,,—a,,)) /x 基于 相似 性 的 通用 函数 */ 
STOP AFTER N; /* 答案 (结果 集 ) 中 最 多 六 个 商品 a 


6.5 项 目 和 案例 研究 的 经 验 


CW Advisor 系统 在 2002 年 实现 了 商业 化 ， 自 此 被 超过 35 个 不 同 的 应 用 中 所 使 用 。 它 
们 已 经 覆盖 了 从 理财 服务 [17] 到 电子 消费 品 或 旅游 应 用 [32] 等 商业 领域 。 在 认为 推荐 系统 
不 擅长 的 应 用 领域 ， 如 提供 商业 计划 咨询 服务 [28]， 或 者 支持 软件 工程 师 筛选 合适 软件 评 
价 方法 [43]， 也 得 到 了 很 好 的 发 展 。 

在 这 样 的 基础 上 ， 不 同形 式 的 经 验 主义 研究 已 经 兴起 ， 他 们 尝试 着 评估 基于 推荐 系统 
的 知识 的 影响 力 和 商业 价值 ， 也 找到 了 改进 他 们 最 先进 技术 的 机 会 。 在 下 文中 ， 在 他 们 的 
研究 设计 深入 用 户 研究 、 历 史 数 据 评估 和 生产 系统 的 案例 研究 的 基础 上 ， 我 们 将 对 他 们 进 
行 区 分 。 

实验 用 户 研究 模仿 真实 用 户 交互 ， 并 探索 不 同 假设 下 的 结果 是 接受 还 是 拒绝 。 文 献 
[15j 引 出 了 一 项 研究 来 评估 会 话 式 的 、 基 于 知识 的 推荐 算法 特定 函数 的 影响 ， 如 推荐 解 
释 、 推 荐 的 修正 方案 或 商品 比较 。 这 项 实验 随机 地 把 用 户 分 配 到 不 同 版 本 的 推荐 系统 中 ， 
它 改变 功能 函数 并 应 用 前 置 或 后 置 交互 调查 ， 来 确定 用 户 的 专业 知识 等 级 、 他 们 的 信任 度 
或 推荐 系统 的 胜任 感 。 非 常 有 趣 的 是 ， 这 项 实验 表明 参与 者 肯定 了 这 些 特 定 功能 函数 ， 因 
为 这 增加 他 们 的 专业 知识 感知 水 平和 对 推荐 结果 的 信任 度 。 

COHAVE 项 目 发 起 一 系列 的 调查 ， 来 研究 心理 学 理论 如 何 能 解释 用 户 在 线 选择 情况 
下 的 行为 。 例 如 ， 非 对 称 显 性 效应 上 升 ， 即 使 所 推荐 的 物品 集 包 含 诱饵 商品 ， 这 些 商品 由 
于 它们 的 相似 性 而 被 其 他 商品 控制 ， 但 是 有 较 低 的 全 局 效用 。 在 如 电子 消费 品 、 旅 游 和 理 
财 服务 等 领域 ， 一 些 用 户 研究 显示 ， 一 个 考虑 了 这 些 影响 的 推荐 系统 ， 能 和 购买 决策 中 的 
用 户 信任 度 一 样 ， 增 加 一 些 特定 物品 的 转换 率 。 C 

基于 历史 数据 的 算法 评价 ”一 份 包含 以 往 用户 交 易 的 数据 集 被 分 成 训练 集 和 测试 集 
[25]。 训 练 集 用 来 学 习 一 个 模型 或 调整 算法 的 参数 ， 目 的 是 使 推荐 系统 能 在 测试 集 上 预测 
用 户 的 历史 行为 。 这 样 的 评价 方案 使 算法 性 能 的 对 比 研究 成 为 可 能 。 当 协同 和 基于 内 容 的 
推荐 范例 在 文献 中 被 广泛 地 评价 时 ， 基 于 知识 的 推荐 算法 和 其 他 的 推荐 范例 的 对 比 在 以 前 
却 只 引起 很 少 的 注意 。 原 因 之 一 是 他 们 难以 比较 ， 因 为 他 们 需要 不 同类 型 的 算法 输入 : 协 
同 过 滤 典 型 地 利用 用 户 评分 而 基于 约束 的 推荐 系统 却 需要 明确 的 用 户 需 求 、 类 目 数据 和 领 
域 知识 。 所 以 ， 包 含 所 有 类 型 的 输入 数据 集 一 一 像 由 Burke[L14] 提 供 的 主要 数据 集 一 一 允 
许 这 样 的 比较 ， 尽 管 他 们 是 非常 稀 朴 的 。 少 数 中 的 一 个 数据 集 在 文献 [61] 中 有 描述 。 这 个 
数据 集 来 自 一 个 提供 优质 雪茄 的 零售 商 ， 它 包含 了 代表 用 户 购 买 行为 、 输 入 会 话 式 推荐 的 
用 户 需 求 和 带 有 商品 详细 描述 的 商品 类 目的 隐 式 评分 。 然 后 ， 通 过 离线 试验 将 利用 用 户 需 
求 的 基于 知识 的 算法 变种 与 利用 评分 的 基于 内 容 的 协同 过 滤 作 比 较 。 其 中 一 个 很 有 趣 的 结 
果 是 ， 在 以 类 目 覆 盖 率 衡量 的 惊喜 度 上 ， 基 于 知识 的 推荐 系统 的 表现 并 不 比 协同 过 滤 差 。 
如 果 基 于 约束 的 推荐 系统 与 像 CWAdvisor 系统 这 样 的 基于 效用 的 物品 评分 机 制 相关 联 ， 
这 是 格外 正确 的 。 但 是 ， 如 果 有 10 个 或 给 更 多 的 来 自用 户 的 评分 ， 协同 过 滤 在 准确 度 上 
做 得 更 好 。 虽 然 如 此 ， 基 于 知识 的 推荐 系统 的 评估 常常 只 能 衡量 编码 知识 库 的 质量 和 它 本 
身 的 推论 。 

另 一 项 研究 在 [60] 中 功能 化 了 ， 它 聚焦 于 明确 的 用 户 需 求 作为 唯一 的 个 性 化 输入 机 制 
的 情况 。 它 对 比 了 基于 知识 和 协同 过 滤 的 不 同 杂交 变种 ， 协 同 过 滤 认 为 明确 的 需求 是 评分 
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的 另 一 种 形式 。 如 果 用 户 明确 地 表达 了 一 些 特殊 需求 ， 基 于 知识 的 推荐 系统 的 结果 集 被 证 
明 是 非常 精确 的 。 但 是 ， 当 只 有 少量 约束 请 求 而 且 结果 集 很 大 时 ， 排 序 函 数 不 总 能 确定 最 
佳 匹配 的 物品 。 与 此 相反 的 是 ， 协 同 过 滤 学 习 了 需求 和 实际 购买 物品 之 间 的 关系 。 因 此 ， 
这 项 研究 表明 ， 基 于 知识 的 推荐 系统 移 除 了 基于 硬性 条 件 的 替补 者 ， 并 且 协 同 过 滤 算 法 来 
评分 时 ， 串 联 策略 表现 得 更 好 。 

因此 ， 在 文献 [57] 中 ， 基 于 知识 和 协同 过 滤 之 间 的 分 层 混合 方法 被 提 了 出 来 并 得 到 了 
验证 。 在 这 里 ， 协 同 过 滤 学 习 把 用 户 需 求 映射 到 已 购物 品类 目 属性 的 约束 条 件 ， 并 把 它们 
作为 输入 传 给 以 基于 知识 为 主 的 推荐 系统 。 在 历史 数据 上 的 离线 试验 提供 了 初步 证 据 ， 在 
算法 的 准确 率 上 ， 这 样 的 一 个 方法 能 胜 过 来 自 领域 专家 的 知识 库 。 在 这 些 基 本 满意 的 结果 
的 基础 之 上 ， 从 历史 交易 数据 中 自动 提取 约束 条 件 的 研究 将 会 进一步 展开 。 

生产 系统 中 的 案例 研究 ”是 最 实际 的 评价 形式 ， 因 为 用 户 在 真实 环境 下 产生 行为 并 控 
制 内 在 动机 来 使 用 这 个 系统 。 在 文献 [13] 中 报道 了 两 个 来 自理 财 服务 领域 和 电子 消费 品 领 
域 的 商业 项 目 经 验 。 在 后 一 领域 ， 针 对 数码 相机 的 会 话 式 推荐 系统 已 经 得 到 了 应 用 ， 它 在 
一 家 奥地利 的 大 型 比价 平台 上 被 超过 20 万 网 上 购物 者 使 用 。 一 个 在 线 问卷 的 回复 支持 了 
这 个 假设 ， 即 导购 应 用 帮助 用 户 在 面 对 大 量 选择 时 能 更 好 地 给 自己 定位 。 在 使 用 这 个 会 话 
式 推 荐 系统 时 与 没有 使 用 的 对 比 ， 明 显 更 高 比例 的 用 户 成 功 地 完成 了 他 们 的 购物 。 在 理财 
服务 领域 ， 基 于 知识 的 推荐 系统 跟随 着 不 同 的 商业 模式 ， 他 们 支持 销售 代理 商 ， 并 与 潜在 
用 户 相互 作用 。 包 括 销售 代表 的 经 验 主义 调查 指出 ， 当 与 客户 端 交互 时 ， 节 省 的 时 间 是 非 
常 大 的 优势 ， 它 反 过 来 允许 销售 人 员 来 鉴定 销售 机 会 L[13，17] 。 

[58] 中 的 一 个 案例 分 析 研究 了 一 个 基于 知识 的 会 话 式 销售 推荐 系统 如 何 影响 网 上 购物 
者 的 行为 。 他 们 分 析 了 在 引进 推荐 系统 之 前 和 之 后 两 段 时 期 的 销售 记录 。 这 项 研究 的 一 个 
有 趣 发 现 是 ， 在 这 两 段 时 期 内 排名 最 高 的 物品 列表 非常 不 同 。 实 际 上 ， 那 些 在 前 一 阶段 销 
量 很 少 但 是 由 系统 推荐 后 却 很 高 的 物品 ， 折 射出 了 非常 高 的 需求 。 因 此 ， 物 品 的 相对 销量 
能 够 明确 地 展现 出 与 推荐 系统 推荐 这 些 物 品 的 频率 的 一 一 对 应 关系 。 由 推荐 应 用 给 出 的 建 
议 被 用 户 采 用 并 导致 了 在 线 转化 。 这 也 证 实 了 最 初 讨论 的 像 文献 L[15] 中 的 用 户 研究 结果 。 
最 后 ， 另 一 个 基于 知识 的 旅游 推荐 系统 的 评估 旨 在 对 比 转化 率 ， 也 就 是 说 ， 在 交互 式 销售 
导购 的 用 户 与 非 交 互 式 销 售 导购 的 用 户 之 间 ， 下 单 用 户 的 比例 L59]j。 这 项 研究 有 力 地 证 明 
了 ， 那 些 与 交互 式 旅游 向 导 发 生 交互 的 用 户 ， 发 起 一 笔 订 单 请 求 的 概率 是 其 他 用 户 的 两 倍 
甚至 更 高 。 

因此 ， 基 于 以 上 结果 我 们 能 够 下 结论 ， 基 于 约束 的 推荐 已 经 成 功 地 应 用 在 多 处 商业 应 
用 领域 并 得 到 这 些 应 用 用 户 的 承认 。 


6.6 未 来 的 研究 方法 


一 方面 ， 基 于 约束 的 推荐 系统 的 效用 已 经 在 很 多 领域 的 应 用 中 得 到 了 证 明 ; 另 一 方 
面 ， 对 它 的 研究 和 应 用 仍然 存在 很 多 挑战 和 改进 的 空间 。 这 些 改 进 能 帮助 我 们 提升 对 用 户 
的 推荐 质量 ， 拓 宽 应 用 领域 ， 并 开发 推荐 软件 。 

产品 数据 抽取 自动 化 ”一 个 基于 约束 的 推荐 系统 的 好 坏 程 度 取 决 于 它 的 知识 库 & 所 
DA. 知识 库 一 定 要 是 正确 的 、 完 整 的 、 最 新 的 ， 以 确保 高 的 推荐 质量 。 这 些 要 求 意味 着 巨 
大 的 维护 工作 ， 尤 其 在 那些 数据 和 推荐 知识 频繁 改变 的 领域 ， 如 电子 消费 产品 领域 现 
在 ， 这 些 工作 都 由 人 类 专家 来 完成 ， 如 收集 产品 数据 或 者 更 新 基础 规则 。 但 是 ， 在 很 多 领 
域 ， 至 少 那些 产品 数据 能 通过 机 器 从 互联 网 获取 到 的 领域 ， 通 过 互联 网 资源 ， 很 多 推荐 应 
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用 需要 的 数据 都 可 以 获取 收集 得 到 。 在 这 种 情境 下 ， 主 要 的 研究 课题 就 是 如 何 从 不 同 的 信 
息 源 来 获取 产品 数据 ， 并 且 自 动 检测 和 调整 过 时 的 数据 。 这 些 包含 了 识别 相关 数据 源 、 抽 
取 产 品 数据 、 解 决 矛 盾 数 据 问题 等 。 一 个 最 近 的 相关 挑战 来 自 于 如 何 从 书籍 、CD、DVD 
和 电视 节目 等 数字 多 媒体 中 抽取 产品 数据 。 

但 是 ， 机 器 的 问题 在 于 如 何 表达 互联 网 的 数据 ， 互 联网 的 数据 一 般 表 示 为 人 类 易于 获 
取 和 理解 的 信息 的 形式 ， 遗 憾 的 是 ， 现 在 的 机 器 却 很 难 解释 这 些 信 息 。 因 此 ， 一 个 基础 性 
的 研究 课题 就 在 于 我 们 如 何 使 机 器 能 够 像 人 类 一 样 能 读 懂 这 些 信 息 。 其 实 ， 这 个 问题 已 经 
超越 推荐 系统 的 研究 范畴 ， 它 是 语义 网 的 一 个 核心 问题 ， 并 且 也 是 人 工 智能 层面 的 一 个 需 
要 解决 的 关键 问题 。 尽 管 从 现在 来 看 ， 这 个 问题 短期 内 还 很 难 解决 ， 但 是 我 们 仍然 可 以 利 
用 一 些 能 应 用 到 推荐 中 的 数据 。 例 如 ， 在 从 网 页 中 抽取 产品 数据 的 时 候 ， 我 们 可 以 以 表格 
的 形式 来 存储 数据 ， 并 且 去 搜查 数据 ， 查 找 这 些 产品 的 描述 ， 存 储 到 产品 数据 库 中 [31]。 
当然 ， 这 种 方式 成 功 与 否 还 需要 看 特定 的 领域 。 例 如 ， 在 像 数 码 相 机 这 样 的 消费 电子 产品 
中 ， 对 相机 的 描述 都 遵循 一 个 特定 的 结构 (如 不 同 品 牌 的 相机 的 芯片 都 是 相似 的 ); 而 在 另 
外 一 些 领域 ， 如 度假 产品 ， 对 产品 大 多 数 都 是 通过 自然 语言 文本 来 描述 的 。 需 要 提 到 的 
是 ， 相 对 于 将 人 类 可 读 的 语言 翻译 到 机 器 可 执行 的 数据 ， 另 一 种 方式 就 是 将 机 器 可 执行 的 
数据 加 到 后 面 ， 或 者 直接 替代 人 类 才 可 读 的 内 容 。 的 确 ， 在 提供 了 机 器 可 执行 的 数据 的 情 
况 下 ， 一 些 较 强 的 市 场 力量 (如 搜索 引擎 ) 的 服务 会 得 到 提升 。 例 如 ， 如 果 产 品 提供 商 提供 
了 一 些 产品 的 特定 格式 的 数据 ， 那 么 他 们 的 产品 将 会 在 搜索 结果 中 获得 更 好 的 排序 。 但 是 
在 这 种 情境 下 ， 将 这 些 用 于 搜索 的 描述 应 用 到 推荐 意图 中 ， 仍 然 需要 依赖 于 单一 的 授权 问 
题 。 因 此 ， 让 机 器 像 人 类 一 样 读 懂 网 页 的 工作 仍然 是 一 个 重要 的 研究 议题 。 

基于 社会 化 的 知识 获取 ”基于 约束 的 推荐 的 重要 基础 在 于 有 效 的 知识 获取 和 维护 。 过 
去 ， 这 个 问题 就 在 多 个 维度 上 被 阐释 ， 主 要 的 关注 点 在 于 知识 表达 和 问题 的 概念 化 ， 以 及 
通过 处 理 模型 来 获取 和 组 织 领域 专家 的 知识 。 从 历史 来 看 ， 这 些 方法 的 一 个 重要 假设 就 是 
存在 一 个 知识 的 形式 化 方式 ， 并 且 能 导出 一 个 面向 用 户 的 概念 化 和 知识 获取 工具 。 在 现实 
生活 中 的 很 多 案例 中 ， 领 域 知识 排 在 众多 利益 相关 者 的 前 头 ， 典 型 的 例子 在 于 跨 部 门 跨 组 
织 的 商业 规则 或 者 新 兴 的 应 用 中 ， 在 这 里 面 ， 用 户 群 体 在 开放 创新 的 网 络 环境 下 ， 共 享 知 
识 。 最 近 ， 随 着 Web 2.0 和 语义 网 络 技术 的 发 展 ， 协 同 获取 知识 的 机 会 和 问题 又 一 次 成 为 
新 的 兴趣 点 。 至 于 获取 到 的 知识 的 类 型 ， 最 近 发 展 的 关注 重点 在 于 获取 结构 化 的 知识 ， 如 
在 知识 项 的 层面 、 知 识 概念 层面 ， 以 及 他 们 之 间 的 关系 等 。 现 在 新 的 方向 是 更 进一步 地 学 
试 去 协同 地 获取 知识 、 提 炼 领 域 的 约束 、 关 注 商 业 规则 ， 因 为 在 很 多 基于 知识 的 应 用 中 ， 
它们 是 最 重要 的 、 最 频繁 变更 的 ， 因 此 也 是 最 耗费 人 力 物 力 的。 我 们 主要 需要 回 到 以 下 几 
个 问题 : 若 知识 是 由 不 同 的 贡献 者 提供 的 ， 我 们 如 何 检测 和 修复 冲突 地 问题 ? 我 们 应 该 如 
何 正确 地 提问 ， 以 让 我 们 更 好 地 从 贡献 者 那里 获取 知识 ? 我 们 应 该 如 何 提 出 好 的 提议 ， 用 
以 在 不 同 的 、 可 能 只 是 部 分 定义 的 知识 库 中 变更 知识 ? 

术语 知识 获取 通常 涉及 支持 使 用 特定 语言 的 用 户 形式 化 规则 、 约 柬 或 者 逻辑 描述 。 这 
个 任务 在 推荐 系统 中 通常 很 复杂 ， 因 为 推荐 的 输出 包含 了 用 户 对 推荐 物品 的 喜好 。 结 果 就 
是 ， 知 识 获取 必须 要 支持 形式 化 、 调 试 、 测 试 这 些 喜 好 的 描述 [21]。 

更 进一步 ， 高 质量 的 可 解释 的 需求 使 得 满足 搜寻 知识 库 的 任务 更 复杂 。 在 基于 约束 的 
推荐 系统 中 ， 推 荐 理由 的 解释 是 利用 知识 库 的 内 容 生 成 的 。 事 实 上 ， 不 同 的 知识 库 可 能 会 
在 相同 输入 的 情况 下 ， 产 生 相 同 的 推荐 结果 输出 ， 但 是 推荐 的 解释 却 是 不 同 的 。 因 为 一 个 
更 长 远 的 重要 的 目标 就 在 于 让 知识 获取 能 够 支持 形式 化 可 理解 的 知识 库 。 
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推荐 系统 的 知识 库 是 动态 的 ， 遗 憾 的 是 ， 这 些 动 态 不 仅 来 自 于 产品 分 类 的 改变 ， 同 时 
也 来 自 于 用 户 喜 好 的 改变 。 例 如 ， 在 以 前 ， 将 像素 的 数码 照片 打印 在 A4 的 纸 上 就 能 使 用 
户 满意 ， 但 是 随 着 时 间 的 推移 ， 用 户 对 质量 的 要 求 也 变 高 了 。 因 此 自动 的 检测 这 种 变化 并 
且 随 之 调整 的 知识 库 也 是 一 个 有 趣 的 研究 课题 。 

验证 成功 开发 和 维护 一 个 推荐 知识 库 需 要 一 个 智能 的 测试 环境 ， 以 确保 推荐 的 正确 
性 。 特 别 是 在 于 一 些 对 推荐 质量 有 高 要 求 的 应 用 中 (如 理财 产品 )， 一 个 公司 使 用 一 个 推荐 
系统 ， 需 要 确保 它 的 推荐 过 程 和 结果 的 质量 。 于 是 ， 未 来 的 研究 需要 关注 如 何 开 发 一 种 机 
制 ， 能 够 自动 配置 测试 环境 ， 使 得 我 们 可 以 用 最 小 的 测试 样 例 来 尽 可 能 地 识别 错误 。 最 小 - 
化 测试 集 是 很 重要 的 ， 因 为 领域 专家 需要 人 工 来 验证 它们 。 这 种 验证 输出 与 知识 获取 恰巧 
匹配 ， 因 为 任何 知识 工程 师 的 反馈 都 能 为 推荐 知识 库 所 用 。 特 别 地 ， 一 个 有 趣 的 研究 问题 
在 于 如 何 利 用 用 户 喜欢 或 者 讨厌 的 反馈 来 提升 知识 库 。 文 献 L[51] 介 绍 了 一 种 算法 来 告诉 我 
们 如 何 研 究 知识 库 来 回答 为 什么 一 个 产品 该 推荐 或 者 不 推荐 。 

组 合 产品 和 服务 的 推荐 100 多 年 前 ， 随 着 Model T 的 生产 ，Henry Ford 用 大 规模 
制造 (许多 同一 商品 的 高 效 量 产 ) 颠 覆 了 制造 业 。 然 而 今天 ， 大 规模 制造 已 是 一 个 过 时 的 
商业 模型 ， 公 司 必须 提供 能 够 满足 用 户 个 性 化 需求 的 产品 和 服务 。 在 这 种 环境 下 ， 大 规 
模 定制 一 一 在 大 规模 制造 的 成 本 下 ， 高 度 多 样 性 产品 和 服务 的 量 产 一 一 已 成 为 新 的 商业 
典范 。 伴 随 着 大 规模 定制 ， 大 规模 的 混乱 也 随 之 而 来 ， 面 对 海量 的 商品 ， 用 户 难 以 选 
择 。 开 发 应 用 于 结构 化 产品 和 服务 的 推荐 技术 有 利于 解决 这 种 大 规模 混乱 的 难题 。 例 
如 ， 推 荐 技术 能 够 帮助 不 知情 用 户 在 一 个 几乎 有 无 限 产 品 的 领域 中 发 掘 他 的 愿望 、 需 求 
和 对 产品 的 要 求 。 但 是 ， 结 构 化 产品 的 推荐 仍然 受到 现在 技术 手段 的 限制 。 当 前 的 技术 
假设 待 推 荐 的 物品 能 够 具体 地 展示 。 但 是 ， 结 构 化 领域 常常 提供 这 样 的 一 个 高 度 产品 差 
异 ， 即 一 系列 可 能 的 组 合集 只 能 以 结构 化 描述 为 内 在 特征 。 例 如 ， 结 构 化 的 系统 或 许 包 
含 了 数 以 千 计 的 部 件 和 连接 器 。 在 这 些 领域 ， 找 到 满足 用 户 需 求 的 最 好 组 合 是 一 个 很 有 
挑战 性 的 问题 。 

可 理解 性 和 可 接受 性 为 了 具有 说 服 力 ， 推 荐 系统 必须 给 出 用 户 推荐 理由 。 当 用 户 可 
以 质疑 一 次 推荐 ， 并 且 探 究 系统 推荐 一 个 特定 的 物品 的 原因 时 ， 用 户 就 会 开始 相信 这 个 系 
统 。 一 般 来 说 ， 推 荐 的 理由 (或 解释 ) 往 往 在 给 出 推荐 结果 的 时 候 一 并 给 出 ， 用 以 达到 增加 
用 户 传递 和 信任 、 说 服用 户 、 提 升 用 户 满意 度 等 目的 。 这 些 解释 依赖 推荐 过 程 中 的 状态 和 
用 户 的 属性 ， 例 如， 她 的 目标 、 需 求 、 先 验 知识 等 。 未 来 推荐 系统 的 愿景 是 ， 对 于 推荐 的 
解释 也 能 够 得 到 优化 ， 例 如 ， 如 果 推 荐 系统 识别 到 一 个 用 户 不 理解 推荐 出 来 的 不 同 产 品 的 
区 别 ， 那 么 这 些 区 别 就 可 以 在 推荐 理由 中 得 到 说 明 。 相 反 地 ， 如 果 一 个 用 户 对 产品 完全 了 
解 ， 并 且 清 晰 地 知道 自己 需要 什么 ， 那 么 推荐 的 解释 则 可 以 为 他 提供 一 个 详细 的 技术 判 
别 。 所 以 ,未 来 的 研究 挑战 在 于 如 何 创建 一 个 人 工 推荐 的 机 制 ， 来 灵活 地 满足 不 同 用 户 的 
需求 。 在 这 些 努力 中 ， 推 荐 理由 和 解释 将 是 一 个 重要 的 基础 。 

用 户 购买 行为 理论 ”一 个 真正 智能 的 推荐 系统 能 够 适应 用 户 。 这 意味 着 ， 推 荐 系统 能 
对 用 户 建 模 ， 并 且 能 预测 用 户 在 接受 一 些 信息 之 后 的 反应 。 特 别 地 ， 如 果 我 们 有 一 个 对 用 
户 购买 行为 影响 因素 建 模 的 模型 ， 能 够 对 推荐 系统 的 下 一 步 动作 作出 指导 ， 那 么 对 推荐 系 
统 的 研究 将 很 大 程度 上 受益 于 认 知 和 决策 的 理论 。 有 人 也 许 会 从 伦理 道德 的 角度 来 对 这 种 
推荐 系统 提出 质疑 ， 但 是 用 户 提供 的 所 有 信息 都 会 影响 他 的 购买 行为 。 为 了 更 好 地 规划 好 
推荐 系统 的 开发 ， 和 用 户 进行 沟通 交流 是 一 个 很 重要 的 工作 。 

上 下 文 和 情景 智能 感知 ”推荐 系统 不 仅 是 一 个 简单 的 PC 工具 软件 ， 而 是 在 很 多 情况 
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下 能 做 出 推荐 动作 的 智能 系统 。 例 如 ， 在 未 来 的 辅助 驾驶 技术 中 ， 系 统 能 够 对 各 种 动作 提 
供 建议 ， 如 超车 、 转 弯 、 停 车 等 。 为 了 在 这 种 情况 下 能 提供 推荐 ， 推 荐 系统 必须 能 够 感知 
当时 的 情况 ， 并 且 了 解 用 户 的 目标 。 其 他 典型 的 情景 包括 假期 度假 的 推荐 ， 在 这 种 情况 
下 ， 推 荐 系统 不 仅 需要 知道 用 户 的 喜好 ， 并 且 能 够 知道 时 间 、 季 节 、 天 气 状 况 、 票 务 信息 
等 。 注 意 ， 上 文 提 到 的 情境 的 需求 叫 作 环境 智能 。 传 统 的 电脑 只 是 一 个 单一 的 和 用 户 交互 
的 界面 接口 ， 而 语音 、 手 势 等 都 在 用 户 和 推荐 系统 的 交互 中 扮演 着 重要 的 角色 。 

语义 网 W3C 认为 语义 网 提供 了 一 个 通用 的 平台 ， 在 这 个 平台 上 ， 数 据 能 够 跨越 应 
用 、 企 业 和 社区 的 界限 ， 并 被 共享 和 复 用 。 在 特定 的 语义 网 里 ， 技 术 能 将 数据 联系 起 
来 ， 这 可 以 用 于 实现 一 个 分 散 的 网 络 ， 人 与 人 之 间 的 信任 关系 、 用 户 与 商品 的 关系 都 可 
以 在 这 个 网 络 中 表示 。 基 于 这 种 用 户 和 商品 的 关系 ， 很 多 应 用 都 能 得 到 提升 。 我 们 已 经 
提 到 ， 可 以 从 机 器 可 读 的 信息 中 抽取 产品 信息 和 获取 知识 ， 其 实 我 们 可 以 更 进一步 ， 利 
用 语义 网 的 信息 来 帮助 提升 推荐 的 质量 [22，63]。 尤 其 是 ， 可 以 开发 一 种 机 制 来 识别 有 
用 的 评分 ， 从 而 避 开 一 些 人 为 的 对 系统 的 误导 。 语 义 网 也 允许 我 们 在 推理 阶段 整合 更 多 
的 数据 。 一 方面 ， 由 于 知识 是 由 分 散 网 络 社区 中 的 很 多 人 一 起 贡献 和 维护 的 ， 知 识 获取 
的 任务 也 由 大 家 一 起 完成 ， 这 有 利于 基于 知识 的 推荐 系统 的 提升 。 另 一 方面 ， 很 多 的 研 
究 问题 随 之 而 来 : 如 何 保 证 推荐 的 质量 ? 如 何 获取 有 用 的 和 高 质量 的 知识 源 ? 如 果 确 保 
用 到 的 产品 和 服务 的 描述 在 概念 和 价值 层面 达到 大 家 的 共识 ?如 何 同时 保证 推荐 的 正确 
性 和 完整 性 ? 


6.7 总 结 


本 章 大 致 介绍 了 基于 约束 的 推荐 系统 技术 ， 这 些 技术 在 协同 过 滤 和 基于 内 容 的 技术 有 
明显 缺点 的 情况 下 十 分 有 用 ， 并 且 能 够 应 用 到 大 型 的 复杂 的 产品 类 别 系统 中 。 基 于 约束 的 
推荐 系统 的 可 用 性 已 经 在 一 些 商 业 应 用 系统 中 得 到 证 明 ， 这 些 应 用 已 经 在 本 章 进行 了 介绍 
和 分 析 。 最 后 ， 为 了 引出 这 个 领域 未 来 的 研究 课题 ， 我 们 介绍 了 一 些 未 来 扩展 的 重要 
方向 。 
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Gediminas Adomavicius 和 Alexander Tuzhilin 


摘要 ”在 电子 商务 个 性 化 、 信 息 检索 、 便 携 移动 计算 、 数 据 挖掘 、 营 销 和 管理 学 等 领域 
中 ， 研 究 者 和 从 业者 已 经 开始 意识 到 情境 信息 的 重要 性 。 虽 然 已 就 推荐 系统 领域 开展 了 大 量 
的 研究 ， 但 是 大 多 数 已 有 的 方法 只 是 关注 把 最 相关 的 物品 推荐 给 用 户 ， 却 忽略 了 相关 情境 信 
息 ， 如 时 间 、 地 点 ， 或 是 否 有 人 陪同 (如 看 电影 或 外 出 就 餐 ) 。 本 章 指出 ， 情 境 信息 在 推荐 系 
统 中 有 一 定 的 影响 ， 是 提供 推荐 方案 时 的 重要 参考 。 我 们 将 讨论 情境 信息 的 一 般 概 念 ， 以 及 
如 何在 推荐 系统 里 面 对 情 境 信息 建 模 。 此 外 ， 我 们 将 介绍 三 种 不 同 的 算法 形式 一 一 基于 情境 
的 预 过 滤 、 后 过 滤 以 及 建 模 一 从 而 把 情境 信息 纳入 推荐 流程 中 ， 讨 论 把 几 种 把 情境 感知 推 
荐 技术 整合 为 一 个 统一 框架 的 可 行 性 ， 并 通过 一 个 案例 研究 这 种 整合 方法 。 最 后 ， 我 们 将 讨 
论 情境 感知 推荐 引擎 的 其 他 作用 ， 并 讨论 在 将 来 的 研究 中 重要 以 及 有 潜力 的 方向 。 


7.1 简介 


大 多 数 已 有 的 方法 只 是 把 最 相关 的 物品 推荐 给 用 户 ， 而 不 考虑 其 他 的 环境 因素 ， 如 时 
间 、 地 点 或 是 否 有 人 陪同 (如 看 电影 或 外 出 就 餐 ) 等 。 换 名 话说， 传统 的 推荐 系统 只 应 用 于 
两 类 实体 ， 即 用 户 和 物品 ， 而 并 没有 将 它们 放 人 某 种 情境 中 进行 考虑 。 

然而 ， 在 许多 推荐 系统 的 应 用 中 ， 如 推荐 一 个 旅行 套餐 、 个 性 化 的 网 站 内 容 或 某 部 电 
影 时 ， 只 考虑 用 户 和 物品 可 能 是 不 够 的 一 一 在 某 些 特定 的 场景 下 给 用 户 推 荐 物品 ， 把 情境 
信息 整合 到 推荐 流程 里 也 是 很 有 必要 的 。 例 如 ， 在 考虑 了 温度 的 因素 后 ， 旅 游 推 荐 系统 在 
冬季 推荐 的 度假 地 可 能 和 夏天 推荐 的 度假 地 大 不 相同 。 同 理 ， 在 Web 站 点 上 提供 个 性 化 
的 内 容 的 时 候 ， 我 们 也 需要 确定 把 什么 内 容 在 什么 时 候 推荐 给 访客 。 比 如 ， 在 工作 日 时 ， 
用 户 上 午 访问 网 站 时 可 能 会 倾向 于 浏览 环球 新 闻 ， 晚 上 则 会 浏览 股市 报告 ; 而 在 周末 则 会 
浏览 影评 和 购物 信息 。 

这 些 观察 和 消费 者 的 决策 行为 经 研究 是 一 致 的 : 消费 者 所 做 的 决策 与 当时 的 情境 是 相 
关 的 。 因 此 ， 在 推荐 系统 里 ， 情 境 信息 整合 到 推荐 方法 中 的 广度 和 深度 ， 毫 无 疑问 会 影响 
消费 者 偏好 的 预测 准确 度 。 

最 近 ， 很 多 公司 已 经 开始 把 一 些 情境 信息 引入 推 荐 引 警 里 。 例 如， 互动 式 电台 Sourcetone 
(www. sourcetone. com) 在 给 用 户 挑选 歌曲 时 ， 会 考虑 听众 所 给 出 的 他 当时 的 心情 (情境 )。 在 音 
乐 推荐 引擎 中 ， 一 些 情境 信息 ， 如 听众 的 情绪 ， 会 对 提供 更 好 的 推荐 起 到 帮助 。 然 而 ， 我 们 还 
不 确定 情境 信息 是 否 会 影响 其 他 更 多 的 推荐 应 用 。 
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本 章 讨论 的 课题 是 情境 感知 推荐 系统 (CARS) 以 及 相关 的 一 些 其 他 问题 ， 它 试图 说 明 在 某 
些 应 用 领域 ， 在 数据 可 用 的 前 提 下 ， 情 境 信息 确实 有 助 于 产生 更 好 的 推荐 。 我 们 会 介绍 三 种 主 
要 的 将 情境 信息 整合 进 推荐 系统 里 的 方法 ， 逐 一 分 析 这 三 种 方法 ， 以 及 如 何 将 这 三 种 方法 统一 。 
把 情境 信息 引入 推荐 过 程 中 ， 会 给 终端 用 户 和 推荐 系统 带 来 更 丰富 多 样 的 互动 。 因 此 ， 在 本 章 
我 们 还 会 介绍 能 用 于 情境 感知 推荐 系统 的 推荐 查询 语言 (recommendation query language)， 并 探 
讨 其 灵活 的 交互 能 力 。 

本 章 其 余部 分 安排 如 下 : 7. 2 节 讨论 情境 信息 的 一 般 概 念 以 及 如 何在 推荐 系统 里 对 情境 信 
息 建 模 。7. 3 节 提出 了 把 情境 信息 纳入 推荐 过 程 的 三 种 不 同 的 算法 形式 。7. 4 节 讨 论 了 把 几 种 情 
境 感知 推荐 技术 整合 成 一 个 统一 方法 的 可 能 性 ， 并 通过 一 个 案例 研究 这 种 整合 方法 。 情 境 感知 
推荐 系统 的 一 些 其 他 重要 功能 将 在 7. 5 节 讨 论 ，7. 6 节 会 给 出 本 章 的 结论 以 及 在 该 领域 未 来 的 
一 些 研 究 方向 。 


7.2 推荐 系统 中 的 情境 


讨论 情境 信息 在 推荐 系统 的 作用 和 带 来 的 机 遇 前 ， 在 7. 2. 1 节 先 讨论 情境 的 基本 概念 。 
然后 ， 在 7. 2. 2 节 重 点 关注 推荐 系统 ， 并 解释 情境 是 如 何 定义 并 在 推荐 系统 中 建 模 的 。 


7.2.1 什么 是 情境 


情境 是 一 个 多 方面 的 概念 ， 在 不 同 的 学 科 ， 包 括 计算 机 科学 (主要 是 在 人 工 智 能 和 普 适 
计算 、 认 知 科学 、 语 言 学 、 哲 学 、 心 理学 、 组 织 科学 等 都 进行 了 其 相关 研究 。 实 际 上 , 已 经 
有 一 个 完整 的 学 术 会 议 一 一 CONTEXT( 如 http://context-07. ruc. dk) 一 一 在 专门 研究 这 个 话 
题 ， 并 把 它 与 医学 、 法 律 、 商 学 等 其 他 学 科 相 结合 。 例 如 ， 知 名 商学 研究 者 和 从 业者 
C. K. Prahalad 指出 ,“ 想 具有 随时 随地 能 感知 客户 、 了 解 客户 需求 的 能 力 ， 意 味 着 企业 不 仅 
要 提供 有 竞争 力 的 产品 ， 也 需要 提供 别具一格 ， 根 据 客户 所 处 环境 而 改变 的 实时 客户 体验 ”， 
这 会 是 CRM 从 业者 的 下 一 个 主要 研究 问题 (“大 事件 ”)[57]。 

由 于 很 多 学 科 都 对 情境 进行 了 研究 ， 每 门 学 科 往 往 有 其 自己 特有 的 观点 ， 这 些 因素 导 
致 在 不 同学 科 中 ,“ 情 境 ”(context) 这 个 词 的 意义 相对 于 字典 的 标准 定义 “一 些 能 够 对 某 些 
事情 产生 影响 的 条 件 和 环境 ?要 更 具体 一 些 L[70]。 因 此 ， 在 不 同 的 学 科 ， 甚 至 在 这 些 学 科 
的 特定 子 领域 ， 都 存在 着 对 情境 的 不 同 定义 。 

Bazire 和 BrezillonL17] 找 到 并 分 析 了 不 同 领域 的 共计 150 种 情境 的 定义 。 考 虑 到 情境 
概念 的 复杂 性 和 多 面 性 ，150 种 并 不 算 夸 张 。Bazire 和 Breezillon[17] 提 到 : 


Heec eon 很 难 找到 一 个 能 适用 于 任何 学 科 的 情境 的 定义 。 情 境 是 给 定 对 象 的 一 
MERA? 是 能 够 对 对 象 产生 影响 的 所 有 因素 的 集合 吗 ? 是 否 可 以 把 情境 信息 定 
义 为 影响 对 象 的 先 验 因素 ， 还 是 仅 将 其 理解 为 导致 事件 出 现 偏 差 的 后 验 因 素 ? 它 
是 静态 的 还 是 动态 的 ? 在 人 工 智 能 领域 出 现 了 一 些 新 的 方法 …… 在 心理 学 中 ， 我 
们 通常 在 一 个 既定 情况 下 去 研究 一 个 人 的 行为 。 哪 些 情 境 跟 我 们 的 研究 有 关 ? 跟 
人 有 关 的 情境 ? 跟 任务 有 关 的 ? 跟 交 互 有 关 的 ? 跟 当 时 形势 有 关 的 ? 情境 什么 时 
候 开 始 ， 什 么 时 候 停止 呢 ? 情境 和 认 知 之 间 的 真实 关系 又 是 什么 呢 ?” 


由 于 本 书 专注 于 推荐 系统 ， 也 因为 情境 的 概念 非常 宽泛 ， 我 们 试图 把 重点 放 在 与 推荐 系 
统 有 直接 关系 的 领域 ， 如 数据 挖掘 、 个 性 化 电子 商务 、 数 据 库 、 信 息 检 索 、 移 动情 境 感知 系 
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统 、 市 场 营销 和 管理 学 等 。 在 这 些 领 域 中 我 们 遵循 Palmisano 等 [54] 对 “情境 ”概念 的 描述 。 

数据 挖掘 。 在 数据 控 气 中， 情境 有 时 被 定义 为 能 够 标识 顾客 生活 阶段 (life stage) 的 特 
征 性 事件 ， 这 些 事件 可 以 改变 他 /她 的 喜好 、 状 态 和 商业 价值 L18]。 例 如 ， 人 的 特定 生活 
阶段 : 新 工作 、 孩 子 出 生 、 结 婚 、 离 婚 、 退 体 等。 了 解 情 境 信息 有 利于 : (a) 只 选择 相关 
的 数据 来 挖掘 针对 某 个 情境 的 模式 ， 例 如 ， 跟 女儿 的 婚礼 有 关 的 数据 ; (b) 只 选择 相关 的 
结果 ， 即 选择 那些 适用 于 特定 情境 的 数据 挖掘 结果 ， 如 已 发 现 某 人 退休 的 模式 。 

个 性 化 电子 商务 。Palmisano 等 [54] 在 电子 商务 场景 中 ， 使 用 客户 的 购买 意向 作为 一 
个 情境 。 不 同 的 购买 意向 可 能 会 导致 不 同 的 购买 行为 。 例 如 ， 同 一 个 账号 下 同一 个 客户 会 
针对 不 同 的 原因 购买 不 同 的 产品 : 买 一 本 书 来 提高 个 人 的 技能 ， 买 一 本 书 作 为 礼物 ， 或 因 
爱好 而 购买 电子 设备 。 为 了 分 析 不 同 的 采购 意向 ，Palmisano 等 [54] 为 每 一 个 客户 针对 每 
一 次 购买 的 情境 建立 单独 的 档案 ， 并 利用 这 些 档案 建立 独立 的 顾客 模型 。 对 某 些 顾 客 细 分 
群 ， 在 特定 的 情境 下 运用 建立 的 顾客 模型 来 预测 顾客 的 购买 行为 。 这 种 依赖 于 情境 的 客户 
细 分 群 十 分 有 用 ， 因 为 它 能 更 好 地 预测 顾客 在 不 同 的 电子 商务 业务 的 购买 行为 L54] 。 

因为 要 向 客户 提供 个 性 化 的 产品 和 服务 推荐 ， 所 以 推荐 系统 也 与 个 性 化 电子 商务 有 关 。 
在 推荐 系统 中 纳入 并 使 用 情境 信息 重要 性 已 在 文献 L3] 中 证 明 ， 作 者 提出 了 一 个 多 维 的 方法 ， 
除了 使 用 传统 的 用 户 和 物品 信息 进行 推荐 ， 也 可 以 基于 情境 信息 提供 推荐 。Adomavici 等 [3] 
也 说 明了 情境 信息 对 推荐 系统 的 意义 : 在 某 些 情况 下 ， 它 有 助 于 提高 推荐 的 质量 。 

同样 Oku 等 L53] 在 推荐 过 程 中 加 入 额外 的 情境 维度 (如 时 间 、 同 伴 和 天 气 )， 并 使 用 
机 器 学 习 技术 在 餐厅 推荐 系统 提供 推荐 。 经 验 表 明 ， 人 情境 感知 的 方法 在 推荐 精度 和 用 户 满 
意 度 明 显 优 于 同类 的 非 情 境 感知 方法 。 

由 于 本 书 重点 讨论 情境 在 推荐 系统 的 应 用 ， 所 以 将 在 后 面 的 章节 描述 这 类 方法 。 

普 适 移动 情境 感知 系统 。 在 移动 情境 感知 系统 文献 中 ， 情 境 最 初 定义 为 用 户 的 地 理 位 
置 、 用 户 身边 的 人 群 的 身份 及 用 户 附近 的 物品 ， 还 有 这 些 因 素 的 变化 [63]。 其 他 因素 也 陆 
续 被 添加 进来 。 例 如 ，Brown 等 [23] 把 日 期 、 季 节 和 温度 纳入 考虑 。Ryan 等 [61] 增 加 了 
对 用 户 的 身体 和 精神 状态 的 研究 。Dey 等 [33] 则 把 用 户 的 情绪 状态 也 纳入 情境 ， 同 时 将 情 
境 的 概念 拓展 为 “任何 可 以 描述 ， 且 和 用 户 与 业务 交互 有 关 的 信息 ”。 有 些 研究 认为 情境 信 
息 与 用 户 关联 [33，35]， 而 另 一 些 则 强调 情境 与 业务 相关 [60，69]j。 最 近 ， 出 现 了 一 些 其 
他 的 可 用 于 情境 感知 系统 的 技术 ,包括 在 移动 应 用 中 采用 的 混合 技术 [59，71]、 视 觉 推 荐 
系统 中 的 图 形 化 模型 等 [20] 。 

情境 信息 对 给 移动 用 户 提供 的 各 种 基于 位 置 的 服务 (LBSes) 是 至 关 重 要 的 [64]。 例 如 ， 
百老汇 剧院 可 能 想 在 演出 开始 前 30min， 给 纽约 时 代 广 场 游客 推荐 打折 力度 很 大 的 剧院 门 
票 (因为 这 些 门票 在 演出 开始 后 就 会 浪费 )， 并 把 这 些 信息 发 送 到 游客 的 智能 电话 或 其 他 通 
信 装 置 里 。 在 这 个 业务 场景 ， 位 置 和 通信 终端 的 类 型 (如 智能 电话 ) 构 成 本 次 业务 的 情境 信 
息 。Brown 等 [22] 给 出 了 另 一 个 有 趣 的 业务 应 用 ， 人 允许 游客 与 远方 的 朋友 分 享 他 们 的 观光 
体验 ， 这 体现 了 情境 感知 技术 在 社交 活动 中 的 价值 。 

文献 [30] 是 一 份 关于 情境 感知 移动 计算 的 研究 调查 ， 其 中 讨论 了 情境 信息 的 各 种 模 
型 、 情 境 感 知 技术 、 不 同 的 业务 架构 以 及 一 些 情境 感知 的 应 用 实例 。 

数据 库 。 某 些 数 据 库 管理 系统 已 经 可 以 支持 情境 查询 功能 。 在 这 里 ， 查 询 语句 综合 考虑 
了 用 户 偏好 ， 将 返回 不 同 的 查询 结果 。 查 询 结果 依赖 查询 语句 在 何 种 情境 中 被 解析 ， 以 及 与 
该 情境 下 的 用 户 偏好 。 例 如 ，Stephanidis 等 [66] 引 入 了 一 组 情境 参数 ， 同 时 为 每 个 常规 的 关 
系 属 性 集 ( 即 原 有 的 数据 库 属性 ) 和 情境 参数 ( 即 新 增加 的 情境 属性 ) 的 组 合 定义 了 一 个 偏好 
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(偏好 是 为 每 个 组 合 定义 的 ) 。 然 后 他 们 提出 了 一 种 情境 感知 的 SQL 语句 扩展 ， 以 适应 偏好 和 
情境 。Agrawal 等 [7] 提 供 了 另 一 种 方法 整合 情境 和 用 户 喜 好 的 查询 语言 ， 通 过 开发 对 各 种 偏 
好 进行 综合 评分 的 方法 ， 能 迅速 给 情境 查询 提供 评分 后 的 结果 。Mokbel 和 Levandoski 
的 [52] 描 述 了 能 够 支持 情境 感知 和 位 置 感知 的 数据 库 服务 器 CoreDB， 并 讨论 了 实现 该 系统 的 
几 个 问题 ， 包 括 情境 感知 的 查询 操作 符 、 连 续 查 询 、 多 目标 查询 处 理 、 查 询 优化 等 。 

信息 检索 。 情 境 信息 已 被 证 明 对 信息 检索 和 访问 有 帮助 [40]。 然 而 大 多 数 现 有 的 系统 检 
索 决策 仅仅 基于 查询 语句 和 文档 集合 ， 而 搜索 的 情境 信息 往往 会 被 忽视 [9]。 主 动 检索 系统 
的 效果 取决 于 执行 基于 情境 的 检索 的 能 力 ， 查 询 返 回 情境 相关 的 结果 [46，65]。 在 Web 搜索 
中 ， 情 境 被 视 为 与 搜索 关键 字 潜在 相关 的 主题 集合 。LawrenceL45] 介 绍 了 如 何 使 用 情境 信息 ， 
并 提出 了 一 些 针 对 不 同 领域 的 基于 情境 的 搜索 引擎 。Maamar 等 [51] 建 议 把 情境 信息 集成 到 
Web 服务 中 。 当 前 大 多 数 情 境 感知 的 信息 服务 和 检索 技术 考虑 的 是 短期 问题 和 用 户 即 时 的 兴 
趣 和 需求 (如 找到 一 个 春季 会 议 期 间 创 建 的 所 有 文件 ， 找 到 的 结果 是 “当时 是 阳光 明媚 的 一 
天 ， 在 纽约 一 家 意大利 餐厅 外 面 >) ， 而 不 是 对 用 户 的 长 期 兴趣 和 偏好 去 设计 和 建 模 。 

营销 和 管理 。 市 场 研究 人 员 已 经 证 实 购买 过 程 在 很 大 程度 上 取决 于 购买 时 的 情境 ， 
为 同样 的 客户 会 根据 情境 做 出 不 同 的 决策 和 选择 不 同 的 产品 或 品牌 [19，50]。 根 据 Lilien 
等 的 结论 L47],“ 消 费 者 的 决策 规则 会 受到 商品 的 使 用 场景 ， 商 品 或 服务 的 用 途 ( 送 给 家 
人 、 礼 物 或 自用 ) ， 购 买 的 场景 (广告 目录 的 销售 、 商 店内 货架 的 选 购 、 销 售 人 员 辅 助 购 
买 ) 的 影响 而 变化 ”。 因 此 ， 能 否 准确 预测 消费 者 的 购买 偏好 ， 取 决 于 我 们 在 多 大 程度 将 相 
关 的 情境 信息 整合 进来 。 在 市 场 研究 领域 ,情境 也 是 行为 决策 理论 领域 的 研究 方向 。 在 
Lussier 和 Olshavsky[50] 中 ， 人 情境 被 定义 为 品牌 选择 策略 中 任务 的 复杂 性 。 

Prahalad 定义 情境 是 [57]“ 在 给 定 的 任何 时 间 ， 客 户 确切 的 物理 位 置 ， 那 一 秒 钟 ， 他 / 
她 所 需要 的 服务 ， 以 及 他 /她 的 能 够 享受 服务 体验 的 移动 设备 ”。 此 外 ，Prahalad[57] 关 注 
那些 能 够 利用 情境 信息 提供 “独特 的 、 实 时 的 客户 体验 ”的 移动 应 用 ， 而 非 提供 有 竞争 力 的 
产品 。Prahalad[57] 提 供 了 一 个 例子 ， 有 一 次 他 把 笔记 本 电脑 落 在 波士顿 一 家 酒店 ， 他 很 
愿意 付 高 额 的 费用 让 酒店 把 电脑 邮寄 给 他 (他 当时 在 纽约 且 急 需 使 用 那 台 电脑 ) 。 

概括 地 说 ，Prahalad[57] 把 情境 信息 区 分 为 三 个 维度 : 时 间 ( 提 供 客 户 体 验 的 时 间 )、 
空间 (提供 推荐 的 地 点 )、 技 术 ( 通 过 何 种 方式 去 提供 推荐 ) Prahalad 虽然 侧重 于 实时 的 经 
验 ( 这 意味 是 目前 的 时 间 ， 即 “现在 ”), 但 是 时 间 维 亦 可 以 推广 到 过 去 和 未 来 (例如 ， 我 想 
在 明 晚 看 一 场 电影 ) 。 

这 一 节 的 内 容 清楚 地 表明 ， 人 情境 是 一 个 多 方面 的 概念 ， 适 用 于 多 种 学 科 ， 每 个 学 科 都 
有 自己 独特 的 视角 ， 并 为 这 一 概念 打上 自己 的 印记 。 所 以 要 给 这 些 多 样 性 的 观点 带 来 一 些 
“秩序 ”， 由 此 DourishL34] 引 入 了 情境 分 类 的 概念 ， 进 而 将 各 种 对 情境 的 定义 归纳 为 “表征 
性 ”和 “交互 性 ”两 种 观点 。 表 征 性 观点 认为 情境 是 一 组 预定 义 可 观察 的 属性 ， 其 结构 (或 模 
式 (schema)， 用 数据 库 术 语 ) 不 随时 间 的 推移 显著 改变 。 换 句 话 说 ， 表 征 性 的 观点 认为 情 
境 属 性 是 可 识别 的 ， 并且 先 验 已 知 的， 因此 ， 可 以 获得 并 在 情境 感知 业务 中 应 用 。 与 此 相 
反 ， 交 互 性 的 观点 认为 用 户 行为 是 相关 的 情境 中 引发 的 ， 情 境 本 身 是 不 可 观察 的 。 此 外 ， 
DourishL34] 假 设 不 同类 型 的 行动 会 产生 和 要 求 不 同类 型 的 情境 信息 ， 基 于 此 可 以 得 到 活 
动 和 相关 的 情境 之 间 的 双向 关系 : 情境 影响 活动 ， 而 不 同 的 活动 也 导致 了 不 同 的 情境 。 

FE 7.2.2 节 中 ,我们 将 考虑 这 些 针 对 情境 的 不 同 的 定义 和 方法 ， 并 使 他 们 适应 推荐 系 
统 需求 本 身 的 特质 。 因 此 ， 我 们 也 将 修订 和 改进 之 前 在 文献 [3，53，72] 等 中 对 推荐 系统 
所 用 情境 的 定义 。 
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7.2.2 在 推荐 系统 实现 情境 信息 的 建 模 


推荐 系统 成 为 一 个 独立 的 研究 领域 是 在 20 世纪 90 年 代 中 期 ， 研 究 人 员 和 从 业者 开始 
关注 推荐 问题 ， 当 时 依赖 于 显 式 的 评分 来 获取 用 户 对 不 同 的 物品 的 喜好 度 。 例 如 ， 对 于 电 
影 推荐 系统 ，John Doe 可 能 给 “Gladiator” 评 7 分 (满分 10 4), BI R,. (John Doe, Gladi- 
ator) 二 7。 推 荐 的 流程 通常 是 从 已 有 的 一 套 评分 集 开 始 的 ， 这 些 评 分 由 用 户 提 供 ， MHA 
统 隐 式 推断 。 当 这 些 初始 评分 数据 准备 好 后 ， 推 荐 系统 会 推导 出 评分 函数 R 给 尚未 评分 的 
(user，item) 对 进行 评分 : 

R:User X Item — Rating 
评分 是 完全 有 序 的 (例如 ， 在 一 定 范围 内 的 非 负 整数 或 实数 ) User 和 Item 分 别 是 用 户 和 
物品 的 取 值 空间 。 一 旦 得 出 整个 UserX Item 空间 的 R 函数 ， 推 荐 系统 可 以 为 每 个 用 户 推 
荐 评分 最 高 的 物品 (或 前 个 最 高 评分 的 物品 )。 称 为 传统 或 二 维 (2D) 系 统 ， 因 为 他 们 在 推 
荐 流程 里 面 只 考虑 用 户 和 物品 两 个 维度 。 

换 句 话说 ， 最 普通 的 做 法 是 ， 推 荐 问题 可 以 归纳 为 预测 一 个 用 户 未 接触 过 的 物品 的 评 
分 。 这 个 预测 通常 是 基于 该 用 户 对 其 他 物品 的 评分 、 其 他 用 户 对 该 物品 的 评分 以 及 一 些 其 
他 可 以 利用 的 信息 (如 用 户 的 自然 属性 、 物 品 特征 ) 给 出 的 。 值 得 注意 的 是 ， 尽 管 现 有 的 推 
荐 系统 研究 已 经 在 该 领域 进行 了 大 量 的 工作 ， 但 绝 大 多 数 现 有 的 方法 在 推荐 物品 给 用 户 或 
推荐 用 户 给 物品 时 没有 考虑 额外 的 情境 信息 ， 如 时 间 、 地 点 或 同伴 (如 看 电影 )。 基 于 此 ， 
本 章 探 索 情 境 感 知 推荐 系统 (CARS) ， 该 系统 通过 将 已 有 的 情境 信息 作为 附加 的 数据 类 型 
整合 到 推荐 流程 里 ， 来 处 理 对 用 户 的 兴趣 和 偏好 的 建 模 和 预测 问题 。 这 种 长 期 的 偏好 和 兴 
趣 通常 以 评分 来 标识 ， 其 对 应 的 模型 不 仅 是 物品 和 用 户 的 函数 ， 也 是 情境 信息 的 函数 。 换 
句 话说， 评分 函数 定义 为 

R:User X Item X Context — Rating 

其 中 ，User 和 Item 分 别 是 用 户 和 物品 的 取 值 域 ，Rating 是 评分 的 取 值 域 ，Context 
声明 了 与 应 用 相关 的 情境 信息 。 为 了 进一步 澄清 这 些 概 念 ， 请 看 下 面 的 例子 。 

在 把 电影 推荐 给 用 户 的 应 用 里 ， 用 户 和 电影 的 关系 描述 包含 以 下 的 属性 : 

。 电影 : 所 有 的 可 以 被 推荐 的 电影 的 集合 ， 它 被 定义 为 Movie(MovieID， 标 题 ， 长 

度 ， 发 行 年 份 ， 导 演 ， 类 型 ) 。 
。 AP: 获得 电影 推荐 的 用 户 ， 它 被 定义 为 User(UserID， 姓 名 ， 住 址 ， 年 龄 ， 性 
别 ， 职 业 )。 4 
另外 ， 情 境 信息 也 包括 了 以 下 三 种 类 型 的 属性 信息 
。 剧院 : 电影 的 电影 院 ， 它 被 定义 为 Theater(TheaterID， 名 称 ， 地 址 ， 容 量 ， 城 
市 ， 省 ， 国 家 ) 。 

。 时 间 : 电影 放映 的 时 间 ， 它 被 定义 为 TimeCH Hj, DayOfWeek, TimeOfWeek, 
A, FE, 年 )。 在 这 里 ， 属 性 DayOfWeek 指 周一 、 周 二 、 周 三 、 周 四 、 周 五 、 
周 六 、 周 日 ， 属 性 TimeOfWeek 指 “ 工 作 日 ?和 "周末 ”。 

。 伙伴 : 代表 了 跟 该 用 户 一 起 去 看 电影 的 一 个 人 或 一 组 人 。 它 被 定义 为 Companion( 伙 
伴 类 型 )， 其 中 的 属性 伙伴 类 型 有 “独自 “朋友 ”“ 男 / 女 朋 友 ”“ 家 庭 ”“ 同 事 " 和 “其 他 ”。 

用 户 对 一 部 电影 的 评分 也 跟 用 户 看 电影 时 的 位 置 、 伙 伴 以 及 时 间 有 关系 。 例 如 ， 推 荐 
给 大 学 生 Jane Doe 看 的 电影 可 能 是 明显 不 同 的 类 型 ， 这 取决 于 她 是 打算 星期 六 晚上 跟 男 朋 
友 去 看 ， 还 是 平日 跟 父母 去 看 。 
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从 这 个 例子 和 别 的 案例 来 看 ， 我 们 可 以 看 到 情境 信息 里 的 Context 可 以 有 不 同类 型 ， 
每 种 类 型 定义 了 情境 的 某 一 方面 ， 如 时 间 、 地 点 (如 剧院 ) 、 伙 伴 ( 例 如 ， 去 看 电影 的 伙伴 ) 
或 购买 目的 等 。 另 外 每 个 情境 的 类 型 都 可 能 是 一 个 反映 了 情境 信息 复杂 性 的 复杂 数据 结 
构 。 虽 然 这 种 情境 信息 的 复杂 度 可 以 有 不 同 的 形式 ， 一 种 比较 流行 的 结构 是 树 状 的 层次 结 
构 ， 这 在 大 多 数 的 情境 感知 推荐 和 资料 系统 比较 常见 ， 包 括 [3j 和 [54]。 比 如 ， 有 三 种 情 
境 会 有 以 下 相关 的 层次 关系 : 剧院 : TheaterID 一 城市 一 省 一 国家 ; 时 间 : 日 期 DayOf- 
Week>TimeOfWeek; 日 期 一 月 一 季度 一 年 9 。 

此 外 ， 我 们 根据 Dourish[L34] 的 表征 性 观点 ， 在 7. 2.1 节 描述 ， 将 情境 定义 为 可 预先 
观察 变量 的 集合 ， 那 么 这 些 数据 结构 并 不 会 随 着 时 间 变 化 而 发 生 重 大 的 改变 。 虽 然 也 有 一 
些 论文 在 文献 利用 交互 的 方法 给 情境 推荐 建 模 ， 如 文献 L11] 通 过 借用 心理 学 的 短期 记忆 
(CSTM) 的 相互 作用 的 方法 对 情境 建 模 ， 大 部 分 情境 感知 推荐 的 研究 遵循 表征 性 的 观点 。 如 
前 所 述 ， 本 章 也 会 采用 这 种 表征 性 的 观点 ， 我 们 会 假设 在 一 个 给 定 的 环境 中 ， 有 一 个 预定 
义 的 情境 类 型 的 有 限 集合 ， 每 种 类 型 都 有 一 个 明确 的 结构 。 

更 具体 地 说 ， 在 一 定 程度 上 我 们 遵循 Palmisano 等 [54] 和 Adomavicius 等 的 看 法 [3]， 
本 节 用 情境 维度 (contextual dimension) RA K 定义 情境 信息 ， 每 个 K 中 的 情境 维度 K 都 
包含 g 个 属性 K= 二 (K'，…，K*)， 其 中 每 个 属性 都 代表 一 类 情境 特征 ， 且 有 层级 结构 ， 
如 时 间 和 通信 设备 。 底 层 属性 K* 的 值 反 映 了 细 粒 度 的 情境 特征 ， 而 项 层 属 性 K' 的 值 反 
映 了 粗 粒 度 的 情境 特征 。 例 如 ， 图 7. 1a 给 出 了 一 个 具有 四 层 结 构 的 情境 属性 K 的 例子 ， 
用 以 说 明 电 商 零 售 业务 中 的 购买 交易 的 意图 。 顶 层 ( 最 粗 级 ) 结 构 定义 了 K 在 所 有 可 能 情 
境 下 的 购买 情况 ， 下 一 级 属性 K' = 二 {Personal，Gift)， 表 示 客 户 的 购买 意图 : 作为 个 人 用 
途 购买 还 是 作为 礼物 购买 ， 进 而 到 更 精细 的 层次 ,“ 个 人 ”属性 K 的 “Personal” 值 可 以 进 
一 步 划 分 成 更 详细 的 个 人 背景 : 个 人 用 途 购买 是 跟 工作 相关 的 还 是 其 他 。 同 样 ， 礼 品 的 值 
K' 可 细 分 为 送 给 合作 伙伴 或 朋友 还 是 送 给 父母 或 其 他 人 。 因 此 ，K? 层级 可 以 定义 为 K= 
(PersonalWork, PersonalOther，GiftPartner/Friend，Gift-Parent/Other}。 最 后 ，K? JB 
性 还 可 以 进一步 划分 为 更 精细 的 层级 ， 如 图 7. 1a 所 示 8 。 


E-retailer DB Food DB 






a) 电子 零售 商 数 据 集 b) 食品 数据 集 
图 7.1 情境 信息 的 层级 结构 


本 小 节 介 绍 在 文献 [ 3] 中 给 出 的 情境 信息 的 定义 : 给 传统 的 用 户 和 物品 的 维度 增加 了 情 
境 信息 ， 如 时 间 、 地 理 位 置 等 ， 也 可 以 通过 基于 OLAPS 的 多 维 数据 模型 (MD) 引 入 ,该 模型 
在 数据 仓库 应 用 中 被 广泛 使 用 [29，41]。 形 式 上 ，D, ，D: ，…，D, 代表 维度 ， 其 中 两 个 维 


O 为 了 保证 完整 性 ， 需 要 指出 的 是 ， 不 仅 在 情景 维度 ， 传 统 的 用 户 和 物品 维度 也 有 层次 关系 的 属性 。 比 如 ， 
实例 1 的 两 个 主要 维度 也 可 能 有 如 下 与 之 相关 的 层次 : 电影 : 电影 编号 一 类 型 用户: 用 户 编号 一 年 龄 ， 
用 户 编号 性 别 ， 用 户 编号 一 职业 。 
日 ”出 于 简洁 和 示意 的 目的 ， 这 个 图 只 做 了 两 路 划分 。 很 明显 ， 三 路 、 四 路 乃至 多 路 划分 都 是 允许 的 。 
© a ME 这 是 一 种 操作 和 分 析 存 储 在 多 维 立方 结构 中 数据 的 常用 方法 ， 并 广泛 运用 于 决策 支 
系统 。 
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度 是 用 户 和 物品 ， 其 余 维度 代表 情境 信息 。 每 个 维度 D, 是 某 些 属性 A; G51, 1s ki) 
称 域 ) 的 笛 卡 儿 积 的 子 集 ， 即 D;|CCAa XA X…X A。 ， 其 中 每 个 属性 定义 一 个 域 (或 一 组 域 ) 
的 值 ( 即 有 自己 的 取 值 空间 ) 。 此 外 ， 一 个 或 多 个 属性 可 以 形成 一 个 键 ， 即 它们 唯一 定义 了 属 
性 的 其 余部 分 [58]。 在 某 些 情况 下 ， 一 个 维度 可 以 由 一 个 单一 的 属性 定义 ， 这 种 情况 下 b 
1。 例 如 ， 设想 一 下 三 维 的 推荐 空间 ，User X Item X Time， 用 户 维 度 可 以 定义 为 User 
UName AddressXIncomeX Age， 即 包含 了 具有 姓名 、 地 址 、 收 入 、 年 龄 的 属性 集合 。 同 样 
地 ， 物 品 维度 可 以 定义 为 temCINameXType XPrice， 即 包含 了 具有 物品 名 、 类 型 和 价格 的 
属性 集合 。 最 后 ， 时 间 维 度 可 以 定义 TimeC YearX MonthXDay， 即 包含 了 从 开始 到 结束 时 
间 的 日 期 列表 (例如 ， 从 2003 年 1 月 1 日 到 2003 年 12 月 31 日 )。 | 

给 定 Di, Dz, ++, D, 维度 ， 定 义 这 些 维度 的 空间 笛 卡 儿 积 S= D, X D; XX Do IE 
外 ， 令 Rating 表示 所 有 可 能 评分 值 的 有 序 集合 ， 那 么 ， 评 分 函数 可 被 定义 为 空间 Di X…X 
D, 上 的 函数 l 

R:D, X: X D, — Rating 

继续 上 面 User X Item X Time 的 例子 ， 定 义 一 个 推荐 空间 User X Item X Time 上 的 评 
分 函数 RR， 用 以 说 明 用 户 wxE User 在 时 间 点 tE Time 对 物品 itemi € Item 的 喜好 程度 。 

直观 上 看 ， 定 义 在 推荐 空间 S= Di X D; X…XD, 上 的 评分 函数 R(di，…，d,) 可 以 
表示 为 一 个 多 维 数据 立方 体 ， 如 图 7. 2 所 示 ， 每 个 立方 体 块 保 存 了 推荐 空间 UserX Item X 
Time 的 某 个 评分 R(xu，i，t)， 图 中 的 三 个 表格 分 别 定义 了 跟 User. Item 和 Time 维度 关 
联 的 用 户 、 物 品 、 时 间 索 引 ( 即 取 值 范围 ) 。 例 如 ， 图 7.2 中 的 评分 ROO, 7, D—6 中 代 
表 为 User ID 101 的 用 在 工作 日 期 间 对 Item ID 为 7 的 物品 评分 为 6。 


R (RATINGS) 


R (101,7,1) 26 
gor? - 


User 


Id Name Ag 


Ce] ERTS 
[10 | Be | 18 | 
Item Id Name 


Ea Weekday 
Holiday 














Fie psp 
ABI7 | 250.0 






IE TIE 
z [m | 1500 | 
s [zz [ss 


E 7.2 推荐 空间 User X Item X Time 的 多 维 模型 


上 述评 分 函数 尺 通 常 是 局 部 函数 (partial function， 即 不 是 所 有 推荐 空间 中 的 点 都 有 定 
义 )， 且 已 预先 知道 某 些 初 始点 上 的 评分 值 。 和 一 般 推荐 系统 一 样 ，R 的 目标 是 估计 剩 下 
未 知 点 的 评分 值 ， 并 将 评分 函数 尺 推 广 到 全 局 。 

上 面 描述 的 基于 传统 OLAP 的 多 维 情境 模型 (以 下 简称 MD 模型 ) 和 之 前 一 般 的 情境 
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层级 模型 之 间 的 主要 差别 在 于 ， 之 前 案例 里 的 情境 信息 都 是 以 一 些 更 普遍 的 层级 分 类 保 
存 ， 如 树 ( 平 衡 和 非 平 衡 ) 、 有 向 无 环 图 (DAG) 或 者 各 种 其 他 类 型 的 分 类 法 。 另 外 ，MD 模 
型 的 评分 保存 在 多 维 立 方 体 中 ， 而 一 般 情 境 模型 的 评分 则 保存 在 更 一 般 的 层次 结构 中 。 

还 想 指出 的 是 ， 并 非 所 有 的 情境 信息 都 有 助 于 推荐 ， 如 书 的 推荐 系统 。 推 荐 系统 可 
以 采集 买书 者 的 各 种 情境 数据 ， 包 括 : (a) 买 书 的 目的 (选项 是 : 为 了 工作 , 为 了 休 
闲 ，…)，(b) 计 划 的 阅读 时 间 ( 工 作 日 ， 周 末 ，…); (c) 计 划 阅 读 的 地 点 (在 家 ， 在 学 
校 ， 在 飞机 上 ，…)，(d) 买 书 时 股市 的 指数 。 显 然 某 些 类 型 的 情境 信息 在 特定 的 场景 中 
可 能 比 其 他 类 型 的 信息 更 重要 。 例 如 ， 前 面 的 例子 中 ， 股 票 指 数 跟 买 书 的 意图 比 起 来 ， 
相关 性 就 显得 不 太 重 要 。 有 几 种 方法 可 以 衡量 情境 信息 与 推荐 动作 之 间 的 相关 性 。 相 关 
性 度量 可 以 手动 完成 ， 例 如 ， 参 考 推荐 系统 设计 者 或 领域 专家 的 知识 ; 或 自动 度量 ， 比 
如 ， 在 数据 预 处 理 阶段 采用 现 有 的 大 量 基于 机 器 学 习 [42]、 数 据 挖掘 L48] 和 统计 学 
L28j 的 特征 选择 方法 。 特 征 选择 方法 的 详细 讨论 超出 了 本 书 的 范围 ， 在 本 章 的 剩余 部 
分 ， 我 们 会 假定 数据 只 存储 了 相关 的 情境 信息 。 


7.2.3 获取 情境 信息 


情境 信息 可 以 通过 许多 方法 获得 ， 包 括 : 
。 显 式 获得 ， 即 通过 直接 接触 相关 人 士 和 其 他 情境 信息 源 ， 通 过 直接 问 问题 或 者 引 
导 性 的 方式 显 式 获取 这 些 信息 。 例 如 ， 一 个 网 站 获取 情境 信息 会 让 用 户 填 写 某 些 
调查 表 ， 等 用 户 回 答 完 相关 问题 后 才能 访问 某 些 页 面 。 
。 隐 式 获得 ， 隐 式 地 从 数据 或 环境 中 获得 ， 例 如 ， 从 移动 电话 公司 获得 用 户 的 位 置 
变动 信息 。 又 如 ， 可 以 从 一 个 事务 的 时 间 戳 隐 式 地 获得 时 间 的 情境 信息 。 我 们 不 
需要 跟 用 户 或 其 他 情境 信息 源 进行 直接 的 交互 ， 就 可 以 直接 从 隐 式 的 情境 信息 源 
中 直接 访问 并 提取 我 们 需要 的 情境 信息 。 
。 推断 获得 ， 我 们 通过 统计 和 数据 挖掘 方法 推断 出 情境 信息 。 例 如 ， 有 线 电视 公司 
可 能 很 难 显 式 获得 电视 观众 的 家 庭 角色 (丈夫 、 妻 子 、 儿 子 、 女 儿 等 )， 但 可 以 通 
过 所 观看 的 电视 节目 相对 合理 和 准确 地 推断 出 来 。 为 了 推断 情景 信息 ， 有 必要 创 
建 一 个 预测 模型 (例如 ， 分 类 器 ) 并 使 用 合适 的 数据 训练 该 模型 。 能 否 成 功 推断 该 
情景 信息 很 大 程度 上 取决 于 这 样 的 分 类 器 ， 并 且 在 不 同 的 应 用 中 有 相当 大 的 差异 。 
如 文献 [54] 中 描述 ， 在 特定 应 用 中 使 用 特定 数据 挖掘 方法 可 以 推断 出 准确 度 相当 
高 的 不 同类 型 的 情景 信息 ， 例 如 朴素 贝 叶 斯 分 类 器 和 贝 叶 斯 网 络 。 
最 后 ， 情 境 信息 有 时 会 以 一 种 潜在 的 形式 “隐藏 在 数据 里 ， 我 们 并 不 一 定 要 显 式 地 得 
到 情境 信息 ， 可 以 直接 隐 式 地 使 用 这 些 信 息 以 获得 对 未 知情 形 更 精确 的 评分 。 例 如 ， 在 前 
面 的 例子 中 ， 我 们 把 家 庭 角色 (丈夫 、 妻 子 等 ) 对 电视 节目 的 喜好 倾向 作为 潜在 变量 进行 
建 模 来 预测 一 个 人 对 某 电 视 节 目的 喜好 程度 。[54] 也 表明 潜在 变量 的 引入 ， 如 购买 的 产 
品 的 意向 (例如 ， 给 自己 的 还 是 送礼 的 ， 与 工作 相关 的 还 是 休闲 用 的 等 )， 虽 然 其 真实 值 
是 未 知 的 ， 但 可 以 显 式 地 将 其 建 模 在 贝 叶 斯 网 络 (BN) 中 ， 的 确 能 够 提高 BN 分 类 器 的 预 
测 性 能 。 因 此 ， 即 使 没有 任何 显 式 的 情境 信息 (例如 ， 家 庭 中 的 哪个 成 员 在 收看 节目 )， 
推荐 的 准确 性 仍然 可 以 通过 使 用 精心 选择 的 能 够 处 理 潜在 变量 的 机 器 学 习 技术 来 改进 
(例如 ， 通 过 在 设计 良好 的 推荐 模型 中 使 用 潜在 变量 )。 文 献 [11] 提 出 了 类 似 的 使 用 潜在 
变量 方法 。 
正如 7. 2.1 节 中 ， 我们 关注 Dourish[34] 提 出 的 表征 性 观点 ， 假 设 情境 被 定义 为 一 组 
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预先 定义 的 情境 属性 ， 其 结构 不 随时 间 改 变 。 这 个 假设 的 含义 是 ， 在 做 出 推荐 前 ， 我 们 需 
要 识别 和 获取 情境 信息 。 如 果 情 境 信息 获取 的 过 程 是 显 式 的 ， 或 者 甚至 是 隐 式 的 ， 也 应 该 
作为 整体 数据 收集 过 程 的 一 部 分 去 执行 。 所 有 这 些 意味 着 情境 信息 是 相关 的 ， 且 在 设计 阶 
段 就 要 明确 需要 收集 哪些 信息 ， 并 在 未 来 的 实际 推荐 中 良好 应 用 。 

Adomavicius 等 [3] 给 出 了 一 种 在 具体 的 推荐 业务 中 ， 对 情境 属性 的 选择 方法 。 特 别 
地 ，[3] 给 出 了 大 量 应 该 由 业务 专家 初步 筛选 出 ， 以 备 后 续 进 一 步 选择 的 情境 属性 。 例 如 ， 
在 例 1 中 描述 一 个 电影 推荐 业务 场景 ， 我 们 可 以 初步 考虑 的 情境 属性 ， 如 时 间 、 剧 院 、 伙 
伴 、 天 气 以 及 其 他 会 影响 看 电影 时 的 情境 属性 ， 这 些 早期 都 是 由 该 领域 的 专家 挑选 的 。 然 
后 ， 收 集 完 评分 数据 和 情境 信息 的 数据 后 ， 我 们 可 能 会 用 各 种 统计 学 方法 测试 所 选择 的 情 
境 属性 与 看 电影 体验 的 关联 ， 通 常 不 同 的 情境 属性 的 评分 会 表现 出 显著 差异 。 例 如 ， 我 们 
可 以 应 用 配对 t 检验， 看 是 否 好 天 气 与 坏 天 气 或 一 个 人 看 电影 和 跟 同伴 一 起 看 是 否 显 著 影 
响 看 电影 的 体验 (通过 评分 分 布 的 统计 学 显著 性 反映 )。 这 个 过 程 表明 ， 可 以 通过 扫描 所 有 
可 考虑 的 情境 属性 ， 过 滤 掉 那些 在 某 个 具体 推荐 业务 中 影响 不 大 的 属性 。 例 如 ， 我 们 可 以 
认为 时 间 、 剧 院 和 同伴 这 些 情境 属性 是 有 意义 的 ， 而 天 气 情况 在 电影 推荐 业务 场景 下 则 不 
需要 考虑 。 


7.3 ”结合 情境 的 推荐 系统 形式 


情境 信息 推荐 系统 的 使 用 可 以 追溯 到 Herlocker 和 Konstan 的 研究 成 果 [36]， 他 们 假 
设 在 某 些 领域 里 ， 把 与 用 户 任务 有 关 的 知识 纳入 推荐 算法 中 能 产生 更 好 的 推荐 。 例 如 ， 如 
果 我 们 想 推荐 那些 作为 礼物 送 给 孩子 的 书 ， 那 么 我 们 可 能 要 指明 哪 几 本 书 是 小 朋友 已 经 拥 
有 的 (喜欢 的 )， 然 后 把 该 信息 ( 即 该 任务 的 档案 ) 提 供给 推荐 系统 计算 新 的 推荐 。 注 意 ， 这 
种 方法 仍然 是 在 传统 二 维 的 UserX Item 空间 里 操作 的 ， 因 为 推荐 任务 对 某 个 用 户 的 描述 
只 包含 了 样本 物品 清单 ; 换 句 话说 ， 除 了 标准 的 User 和 Item 的 维度 ， 并 没有 额外 的 情境 
维度 。 然 而 ， 这 种 方法 成 功 地 告诉 我 们 如 何 将 额外 的 相关 信息 (通过 指定 与 用 户 和 任务 相 
关 的 物品 这 种 形式 ) 纳 入 标准 的 协同 过 滤 体 系 。 此 外 ， 根 据 不 同 主题 打上 兴趣 分 数 也 被 推 
荐 系统 用 于 构建 用 户 情境 属性 [73]。 

在 推荐 系统 中 利用 情境 信息 有 多 种 方法 ， 大 致 可 以 分 为 两 类 : 1) 通 过 情境 驱动 的 查询 
和 搜索 产生 的 推荐 ; 2) 通 过 情境 偏好 提取 和 估计 的 推荐 。 情 境 驱 动 的 查询 和 搜索 方法 已 被 
各 种 移动 和 旅游 推荐 系统 采用 [2，27，68]。 使 用 这 种 方法 的 系统 通常 使 用 的 情境 信息 (可 
能 是 直接 询问 并 获得 用 户 当 前 的 情绪 或 兴趣 ， 或 从 环境 中 获得 当地 的 时 间 、 天 气 或 地 理 位 
置 ) 去 查询 或 搜索 某 些 资源 库 ( 如 餐厅 )， 同 时 给 用 户 提 供 匹 配 度 最 好 的 资源 (如 附近 哪些 餐 
馆 在 营业 )。 早 期 运用 这 种 方法 的 是 Cyberguide 项 目 L2]， 对 不 同 的 手机 平台 开发 了 几 种 
导游 原型 。Abowd 等 [2] 讨 论 了 为 给 手机 用 户 提供 导游 服务 所 需 提取 的 特征 ， 比 如 ， 用 户 
当前 和 过 去 的 地 理 位 置 等 情境 信息 就 可 以 在 推荐 和 指引 过 程 产生 作用 。 情 境 感知 导游 系统 
的 研究 文献 还 有 GUIDE[31], INTRIGUE[14], COMPASS[68], MyMap[ 32 | 等 系统 。 

在 推荐 流程 中 还 可 以 通过 情境 偏好 提取 和 估计 进行 推荐 ， 这 也 是 当前 情境 感知 推荐 系 
统 研究 的 一 种 研究 趋势 ， 在 文献 [3，53，55，72] 有 介绍 。 与 前 面 所 讨论 的 情境 驱动 的 查 
询 和 搜索 (推荐 系统 利用 当前 情境 信息 ， 以 及 当前 用 户 给 定 的 兴趣 作为 查询 条 件 去 搜索 为 
最 合适 的 内 容 ) 不 同 ， 使 用 这 种 方法 的 技术 试图 通过 学 习 来 对 用 户 的 偏好 建 模 。 这 可 以 通 
过 观察 系统 中 用 户 和 其 他 用 户 的 交互 行为 ， 或 通过 获取 用 户 对 以 前 推荐 的 物品 的 偏好 反 
饶 。 为 了 对 用 户 的 情境 敏感 属性 建 模 并 产生 推荐 ， 这 些 技术 会 采用 基于 内 容 的 协同 过 滤 ， 
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或 者 综合 各 种 情境 感知 的 推荐 方法 ， 或 者 引入 数据 挖掘 和 机 器 学 习 领 域 的 各 种 智能 数据 分 
析 技 术 ( 如 贝 叶 斯 分 类 器 和 支持 向 量 机 ) 。 

两 种 方法 都 有 不 少 研 究 上 的 挑战 性 ， 但 在 接 下 来 本 章 的 重点 会 是 第 二 种 ， 即 近期 流行 
的 应 用 情境 偏好 提取 和 估计 的 研究 方法 。 我 们 想 说 明 的 是 ， 结 合 两 种 方法 中 的 技术 来 设计 
单一 的 业务 系统 是 可 行 的 ( 即 无 论 内 容 驱 动 的 查询 和 搜索 ， 以 及 情境 偏好 提取 和 估计 )。 例 
如 ，UbiquiTO 系统 [27] 实 现 了 一 个 移动 导游 服务 ， 不 仅 可 以 智能 地 适应 特定 的 情境 信息 ， 
也 可 以 使 用 各 种 规则 和 模糊 集 技术 调整 应 用 内 容 以 适应 用 户 的 偏好 和 兴趣 。 同 样 ，News 
@hand 系统 [26] 使 用 语义 技术 提供 的 个 性 化 新 闻 推 荐 ， 这 些 推荐 是 基于 对 用 户 查 询 语句 
的 分 析 或 者 根据 特定 用 户 ( 用 户 组 ) 的 属性 计算 得 到 的 。 

接 下 来 讨论 情境 偏好 暗示 和 估算 技术 。 一 般 来 说 ， 传 统 的 二 维 (UserX Item) 推 荐 系统 
可 以 描述 为 一 个 函数 ， 它 把 用 户 部 分 偏好 数据 作为 其 输入 ,产生 的 每 个 用 户 的 推荐 列表 作 
为 输出 。 这 样 就 得 到 了 图 7. 3 中 的 传统 二 维 推荐 过 程 的 示意 图 ， 它 包括 三 个 组 成 部 分 : 数 
据 ( 输 入 ) 、 二 维 推荐 系统 (函数 ) 、 推 荐 列表 (输出 )。 需 要 注意 的 是 ， 如 图 7.3 所 示 ， 当 基 
于 已 有 数据 的 推荐 函数 被 定义 后 (或 构造 后 ) ， 将 构造 好 的 推荐 函数 应 用 在 给 定 用 户 n 以 及 
所 有 候选 物品 上 ， 以 得 到 每 个 物品 的 预测 评分 ， 再 根据 预测 评分 进行 排序 ， 就 能 获得 被 推 
荐 的 物品 。 在 本 节 的 后 面部 分 ， 我 们 将 讨论 在 这 三 个 组 成 部 分 中 如 何 使 用 情境 信息 来 产生 
三 种 不 同 的 情境 感知 推荐 系统 。 


- 
2 维 推 荐 器 n 
U x I>R 


图 7.3 传统 推荐 流程 的 一 般 组 成 部 分 





在 7. 2. 2 节 中 提 到 ， 传 统 的 推荐 系统 建立 在 用 户 的 部 分 喜好 上 ， 即 部 分 物品 (限定 10 
个 ) 的 用 户 偏好 。 传 统 的 推荐 系统 的 输入 数据 ， 通 常 有 如 二 用 户 ， 物 品 ， 评 分 之 的 格式 。 
相 比 之 下 ， 情 境 感 知 推荐 系统 建立 在 用 户 的 部 分 情境 偏好 知识 的 基础 上 ， 数 据 格式 通常 
是 一 用 户 ， 物 品 ， 情 境 ， 评 分 之 ， 每 条 记录 中 不 仅 包 括 给 定 用 户 对 特定 物品 的 喜好 程度 ， 
同时 也 包括 这 个 用 户 使 用 该 物品 的 情境 信息 (例如 ， 情 境 = 星 期 六 )。 此 外 ， 除 了 用 户 的 描 
述 信息 (如 人 口 统计 学 信息 ) ， 物 品 的 描述 信息 (如 物品 的 特征 ) 和 评分 信息 (如 多 标准 评分 
信息 ) ， 情 境 感知 推荐 系统 还 可 以 利用 额外 的 7. 2. 2 节 中 提 到 的 情境 属性 ， 如 情境 层次 结 
构 ( 如 星期 六 一 周末 )。 由 于 这 些 额 外 的 情境 数据 的 存在 ， 带 来 了 几 个 重要 的 问题 ， 在 对 用 
户 偏好 建 模 时 如 何 体现 情境 信息 ?我 们 可 否 重用 在 传统 ( 非 情境 ) 推 荐 系统 中 的 知识 积累 去 
生成 情境 感知 的 推荐 吗 ? 我 们 将 在 本 节 详 细 探讨 这 些 问题 。 

在 提供 的 已 有 的 情境 信息 后 ， 如 图 7.4 所 示 ， 我 们 先 从 具备 形式 UXIXCXR 的 数据 
开始 ， 其 中 C 是 额外 的 情境 维度 ， 并 最 终 为 每 个 用 户 生成 情境 推荐 列表 hs ite RR 
而 ,与 未 考虑 情境 信息 的 图 7. 3 不 同 ， 我 们 可 以 把 当前 (或 期 望 ) 的 情境 c 应 用 在 推荐 过 程 
的 不 同 阶段 。 更 具体 地 说 ， 取 决 于 在 哪个 部 分 应 用 了 情境 信息 ， 基 于 情境 偏好 提取 和 估计 
的 情境 感知 的 推荐 流程 可 以 有 三 种 形式 ， 如 图 7. 4 所 示 : 

。 情境 预 过 滤 ( 或 基于 情境 的 推荐 输入 ) 。 在 该 推荐 方式 中 (图 7. 4a) ， 情 境 信息 决定 了 
数据 选择 或 数据 构建 。 换 句 话 说 ， 当 前 的 情境 信息 c 被 用 于 选择 或 构建 相关 的 数据 
记录 集 ( 评 分 ) 。 在 完成 数据 选择 后 ， 评 分 预测 可 以 在 任何 传统 的 二 维 推荐 系统 完成 。 

。 情境 后 过 滤 ( 或 基于 情境 的 推荐 输出 ) 。 在 该 推荐 方式 中 (图 7. 4b)， 情 境 信息 一 开 
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始 被 忽略 ， 全 部 数据 都 使 用 传统 的 二 维 推荐 系统 预测 评分 。 然 后 ， 推 荐 的 结果 会 
针对 每 个 用 户 的 情境 信息 进行 修正 。 

。 情境 建 模 ( 或 基于 情境 的 推荐 函数 ) 。 在 该 推荐 方式 中 (图 7. 4c) ， 情 境 信息 直接 用 
于 建 模 ， 直 接 影响 评分 。 





a) 情境 的 预 过滤 b) 情境 后 过 滤 c) 情境 建 模 
图 7.4 推荐 系统 中 整合 情境 的 方式 


在 本 章 其 余部 分 会 详细 讨论 这 三 种 方式 。 
7.3.1 情境 预 过 滤 


如 图 7. 4a 所 示 ， 人 情境 预 过 滤 的 方法 是 使 用 情境 信息 来 选择 或 构建 相关 性 最 强 的 二 维 
(UserX Item) 数 据 以 用 于 推荐 。 这 种 方法 的 一 个 主要 优点 是 ， 它 允许 应 用 任何 先前 文献 [5j 中 
提出 的 各 种 传统 推荐 技术 。 值 得 一 提 的 是 ， 这 种 方法 的 一 个 可 能 用 途 是 情境 c 本 身 可 以 作为 
一 个 查询 去 挑选 (或 过 滤 ) 有 关 的 评分 数据 。 电 影 推荐 系统 的 情境 数据 过 滤 的 一 个 例子 是 : 如 
果 一 个 人 要 周 六 看 电影 ， 推 荐 电影 时 仅 使 用 周 六 电影 的 评分 数据 即 可 。 注 意 ， 这 个 例子 展示 
的 是 一 个 精确 的 预 过 滤器 。 换 名 话说， 数据 筛选 查询 由 具体 的 情境 信息 构成 。 

例如 ， 根 据 情 境 预 过 滤 的 范式 ，Adomavicius 等 提出 了 一 种 基于 降 维 的 方法 L3]， 把 情 
境 推荐 问题 从 多 维 (MD) 下 降 为 标准 的 二 维 UserX Item 空间 。 因 此 ， 对 任何 情境 预 过 滤 方 
法 来 说 ， 降 维 的 一 个 重要 好 处 是 ， 完 成 降 维 后 ， 以 前 所 有 的 二 维 推荐 系统 的 研究 方法 可 以 
直接 应 用 在 多 维 场 景 中 。 具 体 来 说 ， 令 Roserxtem: UXT 一 Rating 为 任意 二 维 评分 估算 函 
数 ， 给 定 现 有 的 评分 D( 即 刀 包 含 所 有 已 知 的 、 用 户 定 义 的 评分 记录 二 user，item，rating 之 )， 
我 们 也 能 预测 任意 物品 的 评分 ， 如 RBserxnen (John，StarWars) 。 类 似 地 ， 一 个 支持 时 间 情 
境 的 三 维 评分 预测 函数 类 似 的 定义 如 下 : 

RBsexhemxTime :U X I X T > Rating 
Etr, 包含 用 户 定义 的 评分 记录 <user，item，time，rating 之 。 这 样 就 可 以 用 一 些 方法 
将 三 维 预 测 函 数 表达 成 二 维 预测 函数 了 ， 例 如 : 
V G,i,0 C UX IX To Rb me (si ot) = Ro etiem Rete? Cr 7) 

3x [Time-:]xkzk — Ti BA ER. mj DLTime=z](User, Item, Rating) 
表示 从 D 里 面 选择 Time 维度 值 为 上 的 数据 ， 且 只 保留 User 和 Item 两 个 维度 ， 以 及 评分 
本 身 的 值 。 也 就 是 说 ， 如 果 我 们 把 一 个 三 维 评分 数据 集 D 当成 一 种 关系 ， 那 么 DL Time— 
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t](User, Item, Rating) ÆA D 执行 了 选择 和 投影 两 个 关系 运算 后 得 到 另 一 个 关系 。 

但 是 ， 确 切 的 情境 有 时 会 过 于 狭 隐 。 举 个 例子 ， 跟 女 朋 友 在 周 六 去 影院 观看 电影 的 情 
境 ， 即 = 女友 ， 剧 院 ， 周 六 ) 。 使 用 如 此 确切 的 情境 作为 数据 过 滤 条 件 可 能 是 有 问题 的 ， 
这 里 有 几 个 原因 。 首 先 ， 某 些 方面 过 于 具体 的 情境 可 能 并 不 是 很 重要 。 例 如 ， 用 户 带 着 女 
朋友 在 周 六 去 影院 看 电影 的 偏好 ， 可 能 和 周 日 完全 一 样 ， 但 是 跟 周 三 不 同 。 因 此 ， 宽 泛 一 
点 的 情境 可 能 更 适合 一 些 ， 即 周末 ， 而 不 是 周 六 。 此 外 ， 在 确切 的 情境 下 可 以 被 用 来 做 评 
分 预测 的 数据 可 能 很 少 ， 这 在 推荐 系统 领域 称 为 “稀疏 性 ”问题 。 换 名 话说， 推荐 系统 中 可 
能 并 没有 很 多 用 户 带 上 女 朋 友 周 六 去 看 电影 的 历史 数据 。 

情境 泛 化 。Adomavicius 等 介绍 了 泛 化 预 过 滤 的 概念 L3]， 人 允许 把 具体 的 情境 数据 在 预 
过 滤 查 询 中 泛 化 。 定 义 : c =(cl，…，ct) 是 情境 信息 c= (ce，…，co) 的 泛 化 ， 当 且 仅 当 
coc; 对 于 每 个 i 二 1，…, 上 & 都 位 于 相同 的 情境 层级 。 这 样 ，c (而 不 是 c) 就 可 以 被 用 作 数 
据 检 索 条 件 从 而 获得 基于 情境 的 评分 数据 。 
根据 情境 信息 泛 化 的 概念 ，Adomavicius 等 L3] 提 出 不 要 使 用 简单 的 预 过 滤器 
[Time==t]， 这 里 的 t+ 是 评分 (u，i, 的 确切 情境 ， 而 应 该 使 用 一 般 化 的 预 过 滤器 
[Time€ S,]，S, 代表 情境 信息 i 的 一 个 集合 。S, 在 这 里 被 称 作 情境 分 块 。 例 如 ， 如 果 
我 们 想 预 测 John Doe 在 周一 有 多 想 看 “ 角 斗 士 >， 即 计算 ROoorxttemx ri (JohnDoe, Gladi- 
ator，Monday)， 我 们 可 以 不 用 用 户 给 出 的 Monday 评分 去 做 预测 ， 而 是 可 以 使 用 
Weekday 这 种 泛 化 的 评分 。 换 句 话说 ， 对 于 每 个 (u，i, 2 PH tE Weekday， 我 们 可 


以 通过 Rex nemx Time CU » i, t) = ROLLE Weekday] (User DA AGC Rating Cu, i) 预测 评分 。 更 一 般 
地 ， 为 了 预测 某 些 评分 RC(u，i，t), 我 们 可 以 使 用 某 些 特定 的 情境 信息 分 块 S,: 
RE. TUNE (u, i, t) = ROL TimeE 1€ S, )CUse r, Item, AGGR( Ratin n9 (Cy, ps 


注意 ,我 们 已 经 在 上 面 的 表达 式 使 用 了 AGGR(Rating)( 即 聚合 函数 ) 的 概念 。 这 是 因 
为 ， 在 数据 集 D 的 同一 情境 分 块 S, 中 ， 在 不 同 的 时 间 下 同一 用 户 对 同一 物品 可 能 会 有 不 
同 的 评分 (例如 ， 同 样 的 用 户 ， 同 样 的 电影 在 Monday 和 Tuesday 得 到 的 评分 不 同 ， 但 都 
属于 工作 日 分 段 )。 因 此 ， 我 们 必须 使 用 聚合 函数 来 聚合 值 ， 例 如 ， 在 对 推荐 空间 降 维 时 
计算 评分 的 均值 。 上 述 三 维 降 维 方法 可 以 推广 到 一 般 的 预 过 滤 方 法 ， 将 任意 1 维 推荐 空间 
降 维 到 m EGR, mn), ERAR, RIRE m= 二 2， 因 为 传统 的 推荐 算法 是 针对 二 维 
的 推荐 空间 UserX Item 设计 的 。 注 意 ， 由 于 情境 分 类 的 不 同和 所 需要 的 情境 粒度 的 不 同 ， 
通常 存在 多 种 情境 泛 化 的 方案 。 例如， 假设 我 们 有 以 下 的 情境 分 类 (is-a 或 belongs-to 3€ 
系 ) 层 次 : 

。 同伴 : 女 朋友 一 朋友 一 熟人 一 任意 伙伴 ; 

。 地 点 : 剧院 一 任意 地 点 ; 

。 时 间 : 星期 六 一 周末 一 任意 时 间 。 

那么 下 面 给 出 一 些 针对 情境 信息 c= ( 女 朋 友 ， 影 院 ， 星 期 六 ) 可 能 被 泛 化 的 一 些 例子 : 

。 d'= 〈 女 朋友 ， 任意 地 点 ， 星期 六 ); 

c= GAR, 影院 , 任意 时 间 ); 

。 5 二 (熟人, 影院, 周末 ); 

因此 ， 选 择 “ 正 确 ” 的 泛 化 预 过 滤器 成 为 一 个 重要 的 问题 。 bth nt 
择 ， 例 如 ， 每 周 的 某 一 天 可 以 泛 化 为 平日 或 周末 。 另 一 种 方法 更 自动 化 一 些 ， 对 每 个 泛 化 
过 滤器 输出 结果 的 预测 效果 在 过 去 的 数据 上 进行 评估 ， nibii: HER 
最 好 的 泛 化 过 滤器 。 如 何 处 理由 于 情境 粒度 导致 的 计算 复杂 度 是 一 个 有 意思 的 研究 课题 。 
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换 句 话说 ， 在 情境 粒度 很 细 的 业务 场景 里 ， 会 存在 大 量 可 能 的 情境 泛 化 。 这 时 基于 穷 举 的 
技术 是 不 太 可 行 的 ， 需 要 更 有 效 的 贪 禁 算 法 。 相 关 的 工作 有 Jiang 和 Tuzhilin[39] 研 究 的 
最 优 顾 客 分 群 粒 度 使 得 预测 效果 最 优 的 问题 。 在 情境 感知 推荐 系统 场景 下 应 用 这 些 技术 是 
今后 研究 的 一 个 方向 。 

要 指出 的 是 ， 这 种 降 维 方法 还 跟 机 器 学 习 和 数据 挖掘 中 建立 局 部 模型 的 问题 有 关 [10]。 
降 维 方法 建立 局 部 的 评分 估算 模型 ， 只 使 用 用 户 指定 的 条 件 下 (如 早晨 ) 的 评分 进行 推荐 ， 
而 并 非 建立 全 局 性 评分 估算 模型 ， 利 用 所 有 已 有 的 评分 进行 推荐 。 采 用 降 维 方法 很 关键 的 
一 点 是 ， 要 和 弄 清 楚 在 忽略 所 有 与 情境 无 关 的 信息 之 后 ， 局 部 模型 的 推荐 效果 是 否 真 的 优 于 
传统 的 二 维 全 局 模型 。 例 如 ， 使 用 情境 预 过 滤 推 荐 周末 去 电影 院 看 电影 可 能 比较 合适 ， 但 
在 家 里 用 录像 机 看 电影 的 推荐 还 是 使 用 传统 的 二 维 技术 比较 好 。 这 是 因为 降 维 方法 仅 关 注 
了 特定 的 一 部 分 数据 ， 也 只 利用 这 部 分 数据 建 模 并 进行 推荐 ， 从 另 一 个 角度 看 ， 只 利用 部 
分 数据 建 模 会 限制 推荐 物品 的 广度 。 所 以 在 这 里 需要 进行 权衡 : 在 计算 未 知 评分 时 ， 是 参 
考 较 多 的 同类 情境 数据 ， 还 是 只 参考 某 个 特定 局 部 的 数据 (后 者 会 导致 稀 玻 性 问题 ) 。 这 也 
解释 了 降 维 方法 在 某 些 时 候 比 传统 的 二 维 推荐 技术 好 ， 然 而 在 另 一 些 时 候 却 表现 不 佳 的 现 
象 。 在 实际 应 用 中 如 何 选择 这 两 个 方案 取决 于 业务 领域 和 可 用 的 数据 。 基 于 这 一 观察 ， 
Adomavicius 等 [3] 提 出 了 将 情境 预 过 滤器 与 传统 的 二 维 技术 相 结合 的 方法 (即将 传统 的 二 
维 技术 视 为 通过 了 一 个 默认 的 、 并 不 执行 过 滤 的 过 滤器 ) ， 这 种 做 法 将 作为 案例 研究 在 7. 4 
节 进 行 讨论 。 

最 近 的 一 些 研 究 中 ，Ahn 等 [8] 使 用 类 似 情 境 预 过 滤 的 技术 向 移动 用 户 推送 广告 
参考 的 因素 是 用 户 的 位 置 、 兴 趣 、 时 间 ; Lombardi 等 [49] 通 过 分 析 采 用 了 预 过 滤 方法 进 
行 推荐 的 在 线 零 售 商 的 业务 数据 来 评估 情境 推荐 的 效果 。 此 外 ，Baltrunas 和 Ricci[16] 提 
出 了 一 个 和 情境 预 过 滤 稍 有 不 同 的 方法 ， 该 方法 引入 了 一 种 被 称 为 "物品 切 分 ”(item split- 
ting) 的 技术 ,. 这 种 技术 可 根据 情境 的 不 同 将 物品 切 分 为 若干 “虚拟 物品 ”(fictitious item), 
以 找 出 最 适合 当前 情境 的 虚拟 物品 并 进行 推荐 。 类 似 物 品 切 分 的 思路 ，Baltrunas 和 Ama- 
triain[15] 引 入 微 属性 (或 用 户 属性 切 分 ) 概 念 ， 即 将 用 户 属性 切 分 成 几 个 子 属性 (可 能 有 重 
午 )， 每 个 微 属性 都 代表 了 特定 用 户 在 特定 情境 的 特点 。 预 测 则 通过 这 些 情境 下 的 微 属 性 
实现 ， 而 不 是 一 个 单一 的 用 户 模 型 。 这 些 数据 构建 技术 非常 适合 情境 预 过 滤 方 式 ， 因 为 他 
们 遵循 相同 的 基本 思路 (如 前 所 述 ) 一 一 利用 情境 信息 把 多 维 推荐 问题 降 维 到 标准 的 二 维 
User X Item 空间 ， 从 而 允许 使 用 任何 传统 的 推荐 评分 预测 技术 。 


7.3.2 情境 后 过 滤 


如 图 7. 4b 所 示 ， 情 境 后 过 滤 方 法 在 进行 推荐 时 忽略 输入 数据 的 情境 信息 ， 即 在 对 候选 物品 
进行 评分 并 排序 后 ， 再 从 中 任意 选择 前 N 个 进行 推荐 ， 这 里 N 是 预先 设 定 的 。 之 后 ， 情 境 后 
过 滤 方 法 使 用 情境 信息 为 每 个 用 户 调整 获得 的 推荐 列表 。 推 荐 列表 的 调整 有 以 下 方法 : 

。 (在 给 定 的 情境 下 ) 过 滤 无 关 的 推荐 ; 

。 (基于 给 定 的 情境 ) 调 整 列 表 里 推荐 的 排名 。 

例如 ， 在 电影 推荐 业务 中 ， 如 果 一 个 人 想 在 周末 看 电影 ， 而 且 在 周末 她 只 看 喜剧 ， 那 
么 系统 可 以 过 滤 掉 推荐 列表 中 所 有 非 喜剧 的 电影 。 更 一 般 地 ， 人 情境 后 过 滤 方 法 的 基本 思想 
是 在 给 定 场景 下 分 析 给 定 用 户 的 情境 偏好 数据 ， 发 现 特定 物品 的 使 用 模式 (例如 ， 用 户 
Jane Doe 在 周末 只 看 喜剧 ) ， 然 后 用 这 些 模式 来 调整 物品 清单 ， 从 而 产生 更 “情境 相关 ”的 
推荐 。 如 图 7. 5 所 示 。 
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图 7.5 情境 后 过 滤 方 法 的 最 后 阶段 :推荐 列表 的 调整 


如 同 其 他 的 推荐 技术 ， 情 境 后 过 滤 方 法 可 分 为 启发 式 和 基于 模型 的 技术 。 启 发 式 后 过 
滤 方 法 的 重点 是 对 给 定 的 用 户 在 特定 情境 (例如 ， 某 些 情况 下 会 选择 喜欢 的 演员 ) 发 现 物品 
的 共同 特征 (属性 )， 然 后 使 用 这 些 属性 来 调整 推荐 。 这 其 中 包括 : 

e 过 滤 那 些 推荐 物品 中 关键 特征 不 足 的 推荐 (例如 ， 被 推荐 的 电影 须 在 给 定 的 情境 下 

有 至 少 两 个 用 户 喜 欢 的 演员 ) 。 
。 利用 被 推荐 的 物品 中 包含 相关 的 属性 的 数目 给 这 些 物品 进行 排名 (例如 ， 在 特定 场 
景 下 ， 一 部 电影 包含 越 多 用 户 喜 爱 的 明星 排名 越 高 ) 。 

另 一 方面 ， 基 于 模型 的 后 过 滤 方法 可 以 通过 建立 预测 模型 来 计算 用 户 在 给 定 情境 下 选 
择 特定 类 型 物品 的 概率 (例如 ， 在 给 定 情境 下 选择 某 种 类 型 电影 的 可 能 性 )， 然 后 用 这 个 概 
率 调整 推荐 ， 包 括 : 

。 过 滤 那 些 相 关 性 概率 小 于 预定 的 最 小 阔 值 的 推荐 物品 (例如 ， 删 除 那些 被 选中 机 会 

较 小 的 电影 类 型 ) 。 

。 对 预测 评分 和 相关 性 概率 加 权 之 后 ， 给 出 被 推荐 物品 的 排名 。 

Panniello 等 [55] 在 真实 的 电子 商务 数据 集 上 对 预 过 滤 方 法 (7. 3. 1 节 中 讨论 ) 和 两 个 不 同 
的 后 过 滤 方 法 一 一 加 权 和 过 滤 一 一 进行 了 实验 比较 。 加 权 后 过 滤 方 法 将 给 定 情境 的 相关 性 概 
率 作为 权重 计 人 推荐 评分 中 ， 并 据 此 对 推荐 物品 重新 排序 ， 而 过 滤 后 过 滤 方 法 直接 过 滤 掉 与 
给 定 情境 相关 性 概率 较 小 的 推荐 结果 。 实 验 结果 表明 ， 加 权 后 过 滤 方 法 优 于 预 过 滤 方 法 ， 而 
预 过 滤 方 法 优 于 过 滤 后 过 滤 方 法 ， 因 此 ， 方 法 ( 预 过 滤 或 后 过 滤 ) 的 好 坏 取 决 于 给 定 的 业务 。 

,与 情境 预 过 滤 方 法 类 似 ， 情 境 后 过 滤 方 法 的 一 个 主要 优点 是 它 允 许 使 用 任何 已 有 的 传 
统 推荐 技术 [5]。 此 外 ， 与 情境 预 过 滤 方 法 一 样 ， 如 何 将 情境 泛 化 技术 结合 到 后 过 滤 方法 
中 是 一 个 值得 研究 的 问题 。 


7.3.3 情境 建 模 


如 图 7. 4c 所 示 ， 人 情境 建 模 方法 直接 在 推荐 函数 中 把 情境 信息 作为 预测 用 户 对 物品 评 
分 的 显 式 因素 来 考虑 。 与 情境 预 过 滤 和 后 过 滤 都 可 以 使 用 传统 的 二 维 推荐 函数 不 同 ， 情 境 
建 模 的 方法 生成 的 是 真正 的 多 维 推荐 函数 。 它 可 以 直接 生成 一 个 预测 模型 (通过 决策 树 、 
回归 、 概 率 模型 等 技术 )， 或 将 情境 信息 与 用 户 物品 数据 整合 在 一 起 进行 启发 式 计算 ( 即 
Rating— R(User, Item, Context)». ZEMAN 10—15 年 中 ， 人 们 基于 启发 式 或 其 他 预测 
建 模 技术 研究 了 大 量 的 推荐 算法 ， 其 中 的 一 些 可 以 从 二 维 拓展 到 多 维 推荐 环境 。 我 们 将 在 
接 下 来 的 几 个 小 节 介 绍 几 种 可 被 用 于 情境 建 模 的 方法 [4 。 
7.3.3. 1 和 启发 式 的 方法 


” 待 统 的 基于 邻 域 的 二 维 方法 [21，62] 可 以 通过 一 种 简单 的 技术 直接 推广 到 包含 情境 信息 ， 
的 多 维 情形 ， 直接 计算 ” 维 距离 ， 而 非 传统 的 计算 用 户 一 用 户 或 物品 一 物品 相似 度 的 技术 ; 
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我 们 以 UserX ItemX Time 推荐 空间 为 例 ， 来 看 看 这 是 怎么 做 到 的 。 在 这 里 ， 基 于 相关 评 
分 加 权 和 的 传统 最 近邻 启发 式 预测 函数 ri,, 可 表示 为 (其 他 细节 可 参考 文献 [4]]) 
Fae 5k D Wasi. DG uu Xr 


(ui tA Cui D) 


Hp, Wu, i, t), Cu’, i, te) FRR ree MFR raio HRB, k 是 归 一 化 因 
T. BGRWGu, i, D, Qu, i", ) ) BRMRER AC, i OMA, i, COMERS 
间 的 距离 ， 即 distLCu, i, t), Cw’, P. tO], MR. MAB, WAP RBI, re 的 
KERS., W RINGS Wu, i, t), (u, i’, t)) —1/dist[(u, i, t), Cu’, i’, t')], 
也 可 以 有 其 他 各 种 表达 形式 。 通 常 来 说 ， 距 离 度量 dist 的 选择 很 可 能 基于 特定 的 情境 。 其 
中 一 种 简单 方式 是 用 降 维 方法 定义 一 个 多 维 dist 函数 (有 点 类 似 于 7. 3. 1 HR): AS 
虑 相同 情境 信息 下 的 数据 ， 即 | 
: ; -— dist Cu, i), (u'i )], #t=r 
dist[ (4,2, , (u si st )] = Pu 其 他 | 

这 个 距离 函数 使 得 ri,, 仅 依赖 于 具有 相同 时 间 值 1 的 数据 。 所 以 在 这 种 情况 下 ， 我 们 
只 用 和 被 预测 评分 具有 相同 情境 1 的 数据 (wu，i，z) 评 分 作为 依据 ， 将 评分 函数 降 维 为 二 维 
函数 。 此 外 ， 如 果 我 们 进一步 细 化 距离 函数 dist[(u， i), Cu’, iD], RRKT i= 
i 时 用 户 之 间 的 距离 ， 那 么 我 们 将 获得 类 似 于 之 前 描述 的 预 过 滤 方 法 。 而 且 这 种 方法 很 容 
易 扩 展 到 任意 一 个 多 维 的 情况 ， 只 需要 设 定 两 个 情境 t 相同 的 数据 之 间 的 距离 dist[ Cu, 
i), Cu’, i) JENA. 

另外 ， 还 有 一 些 其 他 方法 来 定义 距离 函数 ， 比 如 ， 使 用 加 权 曼 哈 顿 距离 : 

dist[ (ui, , Qu i £0] = wid, (usu) + urd, (i, i) + widsG, t) 
或 加 权 欧 几 里 得 距离 : 


dist[ Cu, i, D, Qu 200] = Mu dt (uu!) + widiGi, i) + widi(t t) 

这 里 di. d; 和 d; 是 分 别 是 用 户 、 物品 和 时 间 的 距离 函数 ， Wi y UU» 和 ws 是 对 每 一 个 
维度 分 配 的 权重 (可 以 根据 它们 的 重要 性 来 确定 权重 )。 总 之 ， 距 离 函 数 dist[ u, i, t), 
(wu'，i'，t')j] 可 以 定义 成 许多 不 同 的 形式 ， 而 在 许多 系统 中 ， 它 通常 只 计算 相同 用 户 或 相 
同 物品 的 评分 。 研 究 距离 函数 的 各 种 形式 ， 并 比较 这 些 不 同 距 离 定 义 对 预测 性 能 的 影响 是 
一 个 有 意思 的 研究 课题 。 
7.3.3.2 基于 模型 的 方法 

针对 传统 的 二 维 推荐 模型 ， 现 已 有 一 些 相关 推荐 技术 的 研究 [5]。 其 中 的 一 些 方 法 可 
直接 扩展 到 多 维 的 情况 [12]， 该 文 的 二 维 技术 优 于 一 些 先前 已 知 的 协同 过 滤 方 法 。 

Ansari 等 [12] 将 用 户 和 物品 的 信息 结合 起 来 ， 建 立 了 一 个 统一 的 基于 回归 、 且 有 层次 
的 贝 叶 斯 偏好 模型 ， 并 使 用 马尔 可 夫 链 蒙特 卡 罗 (MCMC) 技 术 来 估算 该 模型 的 参数 。 具 体 
来 说 ， 我 们 假设 有 Nu 个 用 户 ， 每 个 用 户 u 由 该 用 户 已 观察 属性 组 成 的 矢量 z, 定义， 如 性 ， 
别 、 年 龄 、 收 入 。 还 假设 有 Ni 个 物品 ， 每 个 物品 i 由 该 物品 的 属性 向 量 w 定义 ， 如 价 
格 、 质 量 和 大 小 。 假 设 ra WAP u 对 物品 i 的 评分 ， 其 中 ri 是 一 个 实数 。 METAREN 
在 部 分 (用 户 、 物 品 ) 对 上 有 定义 。 未 知 评分 的 估计 问题 可 以 定义 为 

f= Lup 十 zi 十 tu 十 esevy ~ N(0,07) — NO, AD y; ~ NOT) 

模型 中 已 观察 的 (已 知 的 ) 值 包括 : HP uui 的 评分 rs， 用 户 属性 所， 物品 属性 
ws, URIE zi 二 zw;， 这 里 的 是 克 罗 内 克 积 ， 即 一 个 包含 单个 元 素 z Mw: 的 所 有 可 
能 的 叉 乘 组 合 的 长 向 量 。 直 观 地 说 ， 这 个 公式 提出 了 一 个 用 户 u 的 特征 zx,， 物 品 i 的 特征 
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w;， 以 及 用 户 和 物品 的 交互 作用 (interaction effect) zw 来 描述 未 知 评分 7 的 回归 模型 。 交 
互 作用 源 自 模型 的 层次 结构 ， 其 用 以 捕 提 类 似 如 用 户 的 年 龄 如 何 影响 他 对 某 些 电影 流派 的 
偏好 之 类 的 特征 。 上 述 方程 中 的 向 量 y 表示 回归 模型 中 的 未 观察 (未 知 ) 的 因素 ( 指 交互 作 
用 ) 的 系数 (斜率 )， 类 似 下 面 将 会 讨论 的 回归 模型 中 需要 估计 的 其 他 未 知 系数 。 向 量 y; fX 
表 物 品 i 的 权重 系数 ， 由 物品 i 的 特质 决定 ， 反 映 了 未 在 物品 i 的 档案 中 记录 的 其 他 属性 
对 最 终 推 荐 评分 的 影响 ， 如 导演 、 音 乐 和 电影 中 的 演技 。 同 样 ， 矢 量 4 代表 特定 用 户 
的 权重 系数 ， 由 用 户 的 特质 决定 ， 反 映 了 用 户 “未 在 用 户 档案 中 记录 的 其 他 属性 对 最 终 推 
荐 评分 的 影响 。 最 后 ， 误 差 项 es 是 均值 为 0、 标准 差 ec 的 正 态 分 布 。 此 外 ， 我 们 考虑 一 个 
层次 模型 ， 并 假设 回归 参数 xy ALA, 服从 均值 为 0， 协 方差 分 别 为 下 和 A 的 正 态 分 布 ， 记 
为 7 一 N(0, D, AU~NO, A, XP DIA 未 知 。 综 上 所 述 ， 该 评分 模型 的 参数 是 u 
c. A 和 芽 。 这 些 参数 可 以 用 文献 [12] 中 描述 的 MCMC 方法 从 已 知 评分 数据 中 推导 出 来 。 

尽管 文献 [12] 提 出 的 方法 仅 针对 传统 的 二 维 推荐 系统 ， 它 也 可 以 直接 推广 到 到 情境 信 
息 推荐 系统 。 例 如 ， 假 设 我 们 有 第 三 个 维度 Time， 由 以 下 两 个 属性 (变量 ) 定 义 : DAR 
值 weekend 表明 某 一 部 片子 是 不 是 在 周末 观看 的 及 ; 2) 一 个 正 整数 numdays 表明 观看 这 
部 片子 时 离 片 子 上 映 的 天 数 。 

在 这 种 情况 下 ，Ansari[12] 模 型 可 以 扩展 到 三 维 (时 间 )， 相 关 文 献 可 参考 Adomavici- 
us 和 Tuzhilin[4]: 

ru = rapt + pu 0, + quads dle + 218, wo yu 十 ew 
式 中 , ea NO, c, ¥,~NCO, T), A— NO, A), 6—NQG0, 60, 0; — NCO, AD, 
T7 NO, ID, oa ~N(0, 220, 

该 模型 包括 了 已 观察 和 未 观察 的 用 户 ， 物 品 和 时 间 以 及 它们 之 间 的 交互 对 ri 的 影响 ， 
rw 是 用 户 在 时 间 : 对 电影 i 的 评分 。 变 量 x, 、rw 和 代表 用 户 的 观察 值 ( 如 自然 属性 )， 
电影 的 观察 值 ( 如 流派 ) 和 时 间 维 (如 周末 、 上 上 映 天 数 )。 矢 量 zs 代表 用 户 、 电 影 和 时 间 变 
基 的 交互 作用 ， 其 系数 a 表示 未 观察 到 (未 知 ) 的 回归 直线 ( 即 交互 作用 的 回归 线 ， 交 互 作 
用 都 是 隐 式 的 ) 的 斜率 ， 即 在 上 面 的 回归 模型 中 需要 估计 的 未 知 系数 ， 类 似 以 下 其 他 参数 。 
I] Wt AL. y, 和 9, 代表 未 观测 到 的 其 他 属性 一 一 用 户 ( 如 他 们 的 种 族 )、 电 影 ( 如 故事 、 剧 本 
等 ) 和 时 间 ( 例 如 ， 是 否 在 假期 观看 电影 ， 电 影 上 映 的 季节 等 ) 一 一 的 影响 。 向 量 pi 表示 观 
察 到 的 用 户 和 物品 之 间 的 交互 作用 ， 类 似 定义 qi 和 rs。 向 量 ou 代表 未 观察 到 的 用 户 和 物 
品 交 互 作用 ， 类 似 定义 向 量 rw Me RERNE, RAMKESH u o ADOAIN 
和 ， 可 以 使 用 马尔 可 夫 链 蒙特 卡 罗 方 法 (MCMC)[12j]。 

最 后 ， 请 注意 ， 在 上 述 模型 中 的 需要 估计 的 参数 数量 会 随 着 维度 的 增加 而 增加 ， 
此 ， 评 分 的 稀 朴 性 很 有 可 能 是 一 个 问题 。 如 果 在 某 些 业 务 场 景 下 这 会 是 个 严重 的 问题 ， 所 
以 可 忽略 上 述 模型 中 的 某 些 项 ， 以 形成 一 个 简化 模型 。 例 如 ， 我 们 可 能 会 忽略 qau, MH 
其 他 一 些 项 ， 从 而 得 到 一 个 参数 较 少 的 简单 模型 。 需 要 注意 的 是 ， 这 个 简单 的 模型 仍然 会 
考虑 情境 信息 ， 如 时 间 。 此 外 ， 该 模型 的 参数 估计 非常 耗 时 ， 且 不 可 扩展 。 因 此 ， 研 究 的 
挑战 之 一 是 使 此 类 模型 对 未 知 评分 的 估计 更 具 扩 展 性 且 更 稳定 。 如 何 使 这 些 方法 更 具 扩 展 
性 的 一 些 初步 想法 可 参阅 文献 [67]。 

除了 将 现 有 的 二 维 推荐 技术 扩展 到 多 维 ， 也 出 现 了 一 一 些 专门 为 基于 情境 模型 范式 的 情 
境 感知 推荐 系统 开发 的 新 技术 。 例 如 ， 遵 从 一 般 的 情境 建 模范 式 ，Oknu 等 [53] 直 接 将 额外 
的 情境 维度 (如 时 间 、 伴 侣 和 天 气 ) 整 合 到 推荐 空间 ， 并 使 用 机 器 学 习 技 术 为 餐厅 推荐 系统 
提供 推荐 。 特 别 的 是 ， 他 们 使 用 支持 向 量 机 (SVM) 分 类 方法 ， 把 在 不 同情 境 下 ， 顾 客 喜 
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欢 的 物品 和 不 喜欢 的 物品 ， 看 作 多 维 空间 的 两 个 向 量 集 ， 并 在 这 个 空间 中 构造 一 个 分 割 超 
平面 ， 使 得 两 个 数据 集 之 间 有 最 大 的 距离 。 所 产生 的 超 平面 就 是 下 一 步 推荐 决策 的 分 类 器 
(如 果 物 品 落 在 超 平面 上 的 “喜欢 ”的 一 面 ， 会 给 出 推荐 ， 如 果 它 落 在 了 “不 喜欢 ”的 一 面 ， 
则 不 会 推荐 )。 此 外 ，Oku 等 [53j 经 验 显 示 ， 情 境 感知 SVM 在 推荐 准确 度 和 用 户 满意 度 
上 明显 优 于 非 情境 的 基于 SVM 的 推荐 算法 。 类 似 地 ，Yu 等 [72] 使 用 情境 建 模 方法 ， 通 
过 引入 情境 中 作为 额外 的 模型 维度 ， 混 合 利用 各 种 推荐 技术 (综合 了 基于 内 容 的 贝 叶 斯 分 
类 器 和 基于 规则 的 方法 ) 为 智能 手机 用 户 提供 内 容 的 推荐 。 

最 后 ， 文 献 [1] 给 出 的 个 性 化 的 访问 模型 (PAM) 同样 也 是 基于 模型 的 ， 它 提供 了 一 套 
个 性 化 的 服务 ， 包 括 情境 信息 发 现 、 语 境 化 (contextualization) 、 结 合 Cbinding) 和 匹配 
(matching) 服务 。Abbar 等 [1] 描 述 了 如 何 组 合 这 些 服务 以 形成 情境 感知 推荐 系统 
(CARS)， 并 给 出 了 实现 ， 以 提供 优质 的 情境 感知 的 推荐 。 

本 节 在 预 过 滤 、 后 过 滤 、 情 境 建 模 方法 的 框架 内 描述 了 各 种 将 情境 信息 用 到 推荐 算法 
中 的 方法 。 由 于 CARS 是 推荐 系统 中 的 一 个 新 兴 领 域 ， 本 节 介 绍 的 这 些 方法 只 是 能 给 出 推 
荐 的 初步 方法 ， 更 好 的 方法 需要 且 应 该 进一步 发 展 这 三 种 基本 方法 。 

在 7.4 节 将 讨论 如 何 将 这 些 不 同 的 方法 结合 在 一 起 。 


7.4 多 种 方法 结合 


许多 推荐 系统 文献 都 表明 ， 综 合 几 种 解决 方案 (“混合 ”使 用 或 “组 装 ” 使 用 ) 通 常 比 单一 
方法 更 能 提高 性 能 [24，25，43，56]。 人 情境 感知 推荐 系统 的 三 个 范式 为 合并 人 新 的 方法 提 
供 了 几 种 不 同 的 方式 。 

一 种 可 能 的 方式 是 结合 相同 类 型 的 几 种 模式 。 例 如 ，Adomavicius 等 [ 3] 按照 这 种 方法 
将 几 个 不 同 的 情境 预 过 滤器 结合 在 了 一 起 。 采 用 多 个 预 过 滤器 的 原因 基于 如 下 事实 : 如 前 
所 述 ， 对 相同 特定 情境 通常 可 以 有 多 个 不 同 的 (和 可 能 相关 的 ) 泛 化 。 例 如 ， 人 情境 c= OX 
友 ， 剧院 ， 周 六 ) 可 以 泛 化 为 c 一 (朋友 ， 任 意 地 点 ， 星 期 六 )，c: 一 (熟人 人， 剧院 ， 任 意 时 
间 )， 以 及 一 些 其 他 的 情境 。 根 据 这 个 想法 ，Adomavicius 等 [3] 根 据 每 个 评分 可 能 的 情境 
的 数目 设 定 预 过 滤器 的 数目 ， 再 将 各 个 预 过 滤器 的 推荐 结果 组 合 起 来 。 这 种 方法 的 示意 图 
参见 图 7. 6。 需 要 注意 的 是 ， 组 合 多 个 预 过 滤器 ， 可 以 有 多 种 方法 。 例 如 ， 对 于 一 个 给 定 
的 情境 ，1) 可 以 选择 表现 最 好 的 预 过 滤器 ; 2) 使 用 预 过 滤器 的 “组 合 "。 在 7.4 节 的 其 余部 
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图 7.6 多 预 过 滤器 的 组 合 : 整体 示意 
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另 一 个 有 趣 的 地 方 可 能 来 自 于 复杂 的 情境 信息 通常 可 被 分 成 几 个 组 成 部 分 ， 每 个 情境 
信息 组 成 部 分 的 作用 可 能 是 不 同 的 ， 从 而 有 不 同 的 实现 选择 : 是 用 在 预 过 滤 、 后 过 滤 ， 还 
是 建 模 阶 段 。 例 如 ， 时 间 信 息 ( 平 日 与 周末 ) 可 能 在 预 过 滤 阶 段 最 有 用 ， 但 天 气 信息 (晴天 
与 阴雨 ) 可 能 在 后 过 滤 阶 段 最 有 用 。 确 定 不 同 的 情境 信息 在 情境 感知 推荐 系统 的 最 适用 模 
式 ， 也 是 一 个 有 趣 的 和 有 前 途 的 研究 方向 。 


7.4.1 组 合 预 过 滤器 案例 研究 : 算法 


组 合 评分 估算 包括 两 个 阶段 L3]: 1) 使 用 已 知 的 用 户 指 定 的 评分 ( 即 训练 数据 )， 选 择 
优 于 传统 协同 过 滤 方 法 的 预 过 滤器 ;2) 为 了 在 一 个 给 定 的 情境 下 预测 评分 ， 选 择 该 情境 下 
最 佳 的 预 过 滤器 ， 并 在 这 个 片段 上 使 用 二 维 的 推荐 算法 。 

第 一 阶段 是 预 处 理 阶段 ， 通 常 “ 离 线 ” 执 行 ， 它 可 以 与 任何 传统 的 二 维 评分 估计 方法 A 
一 起 使 用 ， 包 括 以 下 三 个 步 又 [3]， 

。 在 所 有 可 能 的 泛 化 预 过 滤器 中 ， 找 到 那些 包含 大 量 数据 的 情境 分 块 ， 即 分 块 有 超过 ON 

个 以 上 的 评分 ， 其 中 N 是 某 个 预定 的 阔 值 (例如 ， 在 该 案例 中 N-—250. 。 如 果 推 荐 的 空 
间 比 较 “ 小 ”( 指 维度 的 数量 和 每 个 维度 的 属性 范围 )， 可 以 简单 地 对 空间 的 所 有 可 能 的 
分 块 进行 穷 举 搜索 ( 指 遍 历 尝 试 各 种 泛 化 规则 ) 以 获得 大 的 分 块 。 另外， 领域 专家 (如 市 
场 部 经 理 ) 或 一 些 贪 禁 的 启发 式 算法 都 有 助 于 寻找 业务 中 重要 的 大 分 块 。 

。 算法 A 使 用 每 个 在 上 一 步 中 确定 的 泛 化 预 过 滤器 c 进行 预测 ， 其 预测 性 能 由 选 定 
的 性 能 指标 确定 (本 案例 使 用 下 值 (Fl-measure)， 被 定义 为 准确 率 和 召回 率 的 调和 
平均 数 。 后 者 是 两 个 标准 的 ， 广 泛 应 用 于 信息 检索 的 决策 支持 度量 ， 最 近 也 被 引 
人 推荐 系统 [37]) 。 只 有 那些 在 相同 的 数据 分 块 下 ， 算 法 A 进行 情景 预 过 滤 后 性 能 
超过 算法 A 的 标准 版 ， 即 未 进行 预 过 滤 的 ， 这 样 的 预 处 理 器 才 会 保留 下 来 。 

。 对 其 他 的 预 过 滤器 ， 如 果 存 在 预 过 滤器 c 和 使 得 一 以 ( 即 的 泛 化 程度 比 c 要 

高 )， 且 算法 A 使 用 预 过 滤器 c 的 性 能 比 使 用 预 过 滤器 c' 更 好 ， 那 么 c' 被 视 为 多 余 
的 ( 泛 化 程度 不 够 ， 且 不 够 精确 )， 并 在 预 过 滤器 集合 中 将 其 去 掉 。 剩 下 的 情境 分 
块 集合 ， 记 作 SEGM* ， 是 上 述 组 合 方法 “离线 ”阶段 的 工作 结果 。 

一 旦 得 到 了 一 套 高 性 能 的 预 过 滤器 SEGM" ,我 们 可 以 进入 组 合 评分 估算 的 第 二 阶 
Bt. 当 需 要 进行 推荐 时 ， 从 中 选择 一 个 合适 的 预 过 滤器 进行 “实时 ”推荐 。 给 定 推荐 的 具体 
情境 c， 算 法 A 采用 的 最 好 的 预 过 滤器 c'€E SEGM' 满足 c~>c' 或 c=c' 。 如 果 不 存在 这 样 的 
预 过 滤器 c  ， 那 么 标准 的 二 维 非 过 滤 算 法 A( 即 在 整个 数据 集 上 训练 ) 也 可 用 于 预测 评分 。 

本 章 介绍 的 组 合 预 处 理 方法 的 主要 优点 是 ， 它 只 使 用 那些 在 特定 情境 的 情况 下 优 于 标 
准 的 二 维 推荐 算法 的 预 处 理 器 ， 假 如 预 处 理 器 没有 效果 ， 就 继续 使 用 标准 的 二 维 推荐 算 
法 。 因 此 ， 可 以 期 望 组 合 预 处 理 方法 在 实践 中 会 优 于 纯 二 维 的 方法 。 组 合 预 处 理 方法 要 超 
越 二 维 方法 取决 于 许多 不 同 的 因素 ， 如 问题 的 领域 或 数据 的 质量 。 


7.4.2 组 合 预 过 滤器 案例 研究 : 实验 结果 


文献 [ 3] 给 出 了 在 一 个 真实 的 电影 推荐 系统 上 分 别 采用 组 合 预 过 滤器 的 与 传统 的 二 维 
协同 过 滤 (CF) 方 法 进行 性 能 对 比 的 例子 ， 来 评估 7. 4. 1 节 介 绍 的 组 合 方法 的 表现 。 在 此 业 
务 中 ， 除 了 要 求 用 户 评价 自己 的 电影 观赏 体验 ， 用 户 还 会 要 求 说 明 : 1) 时 间 (time): 什么 
时 候 看 了 这 部 片子 (选择 : 平日 、 周 末 、 不 记得 )， 此 外 ， 如 果 在 周末 看 的 ， 是 否 是 电影 的 
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首 映 周末 (选择 : 是 、 否 、 不 记得 ); 2) 地 点 (place) : 看 这 部 片子 的 地 点 (选择 : 在 电影 院 、 
在 家 里 、 不 记得 ); 3) 同 伴 (companion): 和 谁 看 这 部 片子 (选择 : 自己 一 个 人 、 和 朋友 、 
和 男 朋友 / 女 朋 友 、 和 家 人 或 其 他 人 )。 在 过 去 的 12 个 月 (2001 年 5 月 到 2002 年 4 月 ) 共 收 
集 了 117 名 学 生 的 1755 个 评分 。 由 于 一 些 学 生 只 对 很 少 的 电影 给 出 了 评分 ， 忽 略 掉 给 少 
于 10 个 电影 进行 评分 的 学 生 的 数据 。 因 此 ， 从 最 初 的 数据 获得 最 终 的 数据 集 只 有 62 个 学 
生 、202 部 电影 和 1457 个 评分 。 

在 预 过 滤器 选择 阶段 中 ，9 个 大 的 情境 分 块 被 提取 出 来 ， 如 表 7.1 所 示 。 然 而 ， 在 这 
些 分 块 上 用 标准 的 协同 过 滤 技 术 和 情境 预 过 滤 协 同 过 滤 技 术 进 行 性 能 比较 ， 发 现 只 有 4 个 
“高 表现 ”的 分 块 ; 其 中 一 个 没 能 通过 宛 余 校 验 ( 即 7.4. 1 节 中 所 描述 的 预 过 滤器 的 选择 阶 
段 的 步骤 3)。 其 余 三 个 高 表现 的 预 过 滤器 如 表 7.2 所 示 ， 即 SEGM* = ( Theater-Week- 
end, Theater. Weekend), 


表 7.1 预 过 滤器 的 选择 阶段 步骤 1 产生 的 大 的 情境 分 块 























名 称 大 小 描述 
Home 727 | Movies watched at home 
Friends 565 Movies watched with friends 
NonRelease Movies watched on other than the opening weekend 
Weekend 538 Movies watched on weekends 
Theater 526 Movies watched in the movie theater 
Weekday 340 Movies watched on weekdays 
GBFriend 319 Movies watched with girlfriend/boyfriend 
Theater-Weekend 301 Movies watched in the movie theater on weekends 
Theater-Friends 274 Movies watched in the movie theater with friends 


表 7.2 高 表现 值 的 大 情境 分 组 
CF: 分 段 训练 的 F 值 
0. 641 





CF: 全 体 数 据 训 练 的 F 值 

















Theater- Weekend 









0. 608 


最 后 ， 高 表现 的 分 组 SEGM 应 用 于 "在 线 ? 评 分 估算 。 总 体 而 言 ， 二 维 协同 过 滤 和 组 
合 预 过 滤 协 同 过 滤 方 法 ( 受 限 于 相关 数据 的 稀 朴 性 ， 组 合 过 滤 方 法 并 不 能 对 所 有 场景 进行 
预测 ) 都 能 对 其 中 的 1373 个 场景 进行 评分 预测 ( 共 收 集 了 1457 个 ) 。 结 果 表 明 ， 合 并 后 的 
预 过 滤 协 同 过 滤 方 法 大 幅 优 于 传统 的 二 维 协同 过 滤 ( 表 7. 3 第 一 行 )。 


表 7.3 基于 F 值 的 整体 表现 


Theater 





0. 484 





Weekend 





所 有 的 预测 评分 
3% A SEGM* 的 评分 





需要 注意 的 是 ， 如 前 所 述 ， 组 合 预 过 滤 协 同 过 滤 方 法 会 使 用 标准 的 二 维 协同 过 滤 来 预 
测 任何 不 属于 高 表现 预 过 滤器 的 评分 。 因 此 在 本 案例 中 ， 这 两 种 方法 对 不 属于 分 块 {Thea- 
ter-Weekend，Theater，Weekend} 的 预测 结果 是 相同 的 。 由 于 这 种 评分 没有 体现 两 种 方法 
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的 差别 ， 所 以 判断 两 种 方法 在 SEGM; 上 的 评分 差异 就 很 重要 了 。 在 这 种 情况 下 ， 
SEGM"* 包含 743 个 评分 (共有 1373 个 ) ， 这 两 种 方法 的 下 值 差异 是 0.095( 表 7. 3 中 的 第 2 
行 )， 比 前 面 描述 的 场景 提升 幅度 更 大 。 

在 本 节 中 ， 我 们 讨论 了 组 合 多 个 预 过 滤 、 后 过 滤 和 情境 建 模 方法 去 产生 更 好 的 预测 ， 
主要 侧重 于 组 合 多 个 预 过 滤器 ， 基 于 文献 [3]。 我 们 只 列 出 一 些 主要 的 想法 ， 而 把 大 部 分 
的 问题 作为 研究 课题 留待 研究 。 我 们 相信 通过 创造 地 组 合 来 自 机 器 学 习 的 各 种 技术 ， 可 以 
显著 提高 CARS 的 性 能 ， 这 也 是 一 个 重要 而 有 趣 的 研究 领域 。 


7.5 情境 感知 推荐 系统 的 其 他 问题 


除了 将 情境 整合 到 推荐 系统 的 三 个 范式 以 及 将 这 三 个 范式 相 结合 的 方法 ， 情 境 感知 推 
荐 系统 还 有 其 他 几 个 重要 的 课题 ， 比 如 ， 如 何 更 好 地 利用 情境 信息 ， 如 何 让 CARS 具备 更 
丰富 的 交互 能 力 从 而 做 出 更 灵活 的 推荐 ， 以 及 如 何 打造 高 性 能 CARS 系统 。 在 本 节 的 其 余 
部 分 ， 我 们 将 讨论 这 些 问 题 。 

在 预 过滤 、 后 过 滤 以 及 情境 建 模 方法 中 进行 权衡 ， 对 组 合 它们 给 出 更 好 的 解释 。 在 7.3 
节 中 ， 我 们 只 介绍 三 种 一 般 的 CARS 范式 ， 并 没有 考虑 它们 之 间 的 平衡 。 为 了 更 好 地 理解 预 
过 滤 、 后 过 滤 和 情境 建 模 方法 ， 研 究 比 较 了 这 三 种 方法 ， 重 点 了 解 了 这 些 方法 的 相对 优点 和 
缺点 。 文 献 L[55] 给 出 了 这 样 的 研究 ， 对 预 过 滤 方 法 与 一 类 后 过 滤 方 法 在 推荐 的 质量 上 进行 比 
BR. RH, 在 下 值 意 义 下 ， 两 者 在 提供 更 好 的 推荐 方面 不 分 高 下 。 此 外 ，Panniello 
等 [55] 给 出 了 一 种 条 件 判定 方法 ， 该 条 件 满足 时 ， 应 使 用 预 过 滤 而 不 是 后 过 滤 方 法 。 

文献 [55] 的 工作 只 是 一 个 比较 预 过 滤 、 后 过 滤 和 情境 建 模 方法 的 系统 方案 的 第 一 步 ， 
为 了 了 解 三 种 方法 的 优 缺 点 ， 以 及 在 何 种 条 件 下 ， 执 行 哪 种 方法 更 优 ， 还 有 很 多 工作 需 
要 做 。 

同样 ， 需 要 做 更 多 的 工作 去 更 好 地 理解 7. 4 节 讨 论 的 组 合 方法 。 这 是 一 个 富有 成 果 的 研 
究 领域 ， 对 各 种 预 过 滤 、 后 过 滤 和 情境 建 模 方法 的 组 合 方式 还 有 很 大 的 改进 和 提升 空间 。 

.让 CARS 的 交互 能 力 更 丰富 ， 推 荐 更 具 弹 性 。 情 境 感知 推荐 有 以 下 两 个 重要 的 性 质 : 

。 复杂 性 。 由 于 CARS 在 推荐 过 程 中 不 仅 涉及 用 户 和 物品 ， 还 涉及 各 种 不 同类 型 的 

情境 信息 ， 这 种 推荐 比 传统 的 不 包含 情境 的 推荐 ， 可 能 会 复杂 很 多 。 例 如 ， 在 电 
影 推 荐 业务 中 ， 一 个 用 户 ( 如 汤姆 ?可 能 会 需要 推荐 最 适合 他 和 他 女友 在 周末 合适 
的 时 间 观 看 的 前 3 部 电影 。 

。 交互 性 。 情 境 信 息 通常 需要 用 户 在 CARS 中 给 出 。 例 如 ， 要 利用 现 有 的 情境 信息 ， 

CARS 系统 在 提供 针对 情境 的 推荐 前 ， 可 能 需要 用 户 ( 汤 姆 ) 给 出 他 希望 和 谁 看 电 
影 (如 女 朋 友 )， 什 么 时 间 ( 如 在 周末 ) 等 信息 。 

这 两 个 特性 的 结合 会 需要 更 灵活 的 推荐 方法 出 现 ， 让 用 户 可 以 表达 感 兴趣 的 推荐 类 
型 ， 而 不 是 生 搬 硬 套 到 大 多 数 当 前 厂商 所 提供 的 只 将 top-N 物品 推荐 给 用 户 ， 反 之 亦 然 。 
交互 性 的 第 二 个 要 求 ， 还 要 求 开 发 出 支持 用 户 以 交互 和 和 迭代 的 方式 在 推荐 过 程 中 输入 信 
息 ， 且 定义 良好 的 用 户 界面 (UDI) 。 

这 种 灵活 的 情境 感知 的 建议 ， 可 以 从 几 个 方面 来 实现 。 首 先 ，Adomavicits 等 [6] 开 发 
了 推荐 查询 语言 REQUESTS， 它 允许 用 户 以 灵活 的 方式 在 相当 广泛 的 推荐 范围 内 刻画 自 
己 的 个 性 化 需求 ， 从 而 更 准确 地 反映 自身 的 兴趣 。REQUEST 基于 在 7.2. 2 节 和 文献 [3] 


© REQUEST 是 推荐 查询 说 明 (Recommendation QUEry Statement) 的 缩写 。 
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中 描述 的 多 维 情境 推荐 模型 ， 支 持 多 种 特性 ， 有 兴趣 的 读者 可 以 在 文献 [6j 中 找到 这 些 特 
性 的 详细 说 明 、 正 式 的 语法 以 及 这 种 语言 的 各 种 性 质 。 此 外 ，Adomavicius 等 [6] 讨 论 了 
REQUEST 的 表达 能 力 给 出 了 一 种 多 维 推荐 代数 学 ， 为 该 语言 提供 了 理论 依据 。 

到 目前 为 止 ， 我 们 仅 简 要 提 及 的 建议 查询 语言 本 身 。 由 于 引进 这 样 一 种 语言 的 一 个 主 
要 论据 是 其 最 终 用 户 的 使 用 ， 所 以 开发 出 简单 、 友 好 、 简 洁 且 能 支持 灵活 但 往往 复杂 的 情 
境 推荐 的 用 户 界 面 (UD) 也 是 很 重要 的 。 高 品质 的 用 户 界 面 应 简化 用 户 与 推荐 系统 之 间 交 互 
的 复杂 性 ， 使 其 能 用 于 更 广泛 的 用 户 。 开 发 这 样 的 用 户 界 面 是 未 来 研究 的 一 个 课题 。 

提供 灵活 推荐 的 另 一 个 方案 ,可 以 看 看 文献 [44] 描 述 的 FlexRecs 系统 及 其 框架 。 
FlexRecs 方法 通过 把 推荐 过 程 从 执行 过 程 解 看 出 来 ， 以 实现 基于 结构 化 数据 的 灵活 推荐 。 
特别 地 ， 推 荐 可 以 抽象 地 表达 为 一 个 高 层次 的 含 参数 的 工作 流 ， 它 包含 了 传统 的 关系 运算 
符 和 新 的 推荐 相关 的 操作 符 。 

除了 用 开发 语言 来 表达 情境 感知 推荐 ， 提 供 能 够 以 交互 的 方式 表达 灵活 推荐 建议 的 用 
户 界 面 也 是 很 重要 的 。 对 FlexRecs 而 言 ， 这 需要 提供 定义 及 管理 推荐 工作 流 的 用 户 界 面 ; 
对 REQUEST 而 言 ， 这 需要 提供 前 端的 用 户 界 面 及 允许 用 户 直观 地 以 交互 式 的 方式 明确 
查询 要 求 。 

开发 高 性 能 的 CARS 系统 ， 并 在 实际 应 用 中 检验 。 大 部 分 情境 感知 推荐 系统 的 工作 还 是 
概念 性 的 ， 虽 然 也 发 展 了 一 些 方法 ， 并 在 一 些 数据 (往往 是 有 限 的 ) 上 进行 了 测试 ， 而且 在 某 
些 指标 上 表现 不 错 。 可 CARS 领域 革命 性 的 进展 几乎 没有 ， 比 如 ， 在 设计 新 颖 的 数据 结构 、 
高 效 的 存储 方法 以 及 新 的 系统 架构 方面 。Hussein 等 的 论文 [38] 在 这 方面 做 了 一 些 工作 ， 作 
者 介绍 了 一 个 面向 服务 的 架构 ， 允 许 为 情 境 感知 推荐 系统 定义 和 实现 了 各 种 不 同 的 “积木 ”， 
如 推荐 算法 、 情 境 探 测 器 、 各 种 过 滤器 和 转换 器 ， 体 现 了 模块 式 的 风格 。 这 些 “ 积 木 * 可 以 以 
各 种 形式 组 合 和 重用 到 系统 里 进行 情境 的 推荐 。 这 类 工作 的 另 一 个 例子 是 Abbar $1], 4 
者 用 一 种 面向 服务 的 方法 实现 了 其 之 前 提出 的 个 性 化 访问 模型 (PAM)， 该 实现 基于 作者 开发 
的 CARS 的 全 局 软件 架构 [1]。 这 两 篇 论文 在 如 何 使 CARS 更 加 人 性 化 、 更 具 扩 展 性 以 及 更 
好 的 性 能 的 方向 上 迈 出 了 第 一 步 ， 后 续 还 需要 更 多 的 工作 来 实现 这 一 目标 。 


7.6 总 结 


在 本 章 中 ， 我 们 认为 一 些 情境 信息 在 推荐 系统 里 是 有 意义 的 ， 而 且 在 进行 推荐 的 时 候 
考虑 情境 信息 也 是 很 重要 的 。 我 们 还 阐明 了 情境 信息 可 以 在 推荐 过 程 的 不 同 阶 段 中 使 用 ， 
包括 在 预 过 滤 及 后 过 滤 阶段 ， 也 可 以 作为 情境 建 模 中 不 可 分 割 的 一 部 分 。 我 们 也 已 展示 了 
各 种 使 用 情境 信息 的 技术 ， 包 括 上 述 三 种 方法 ， 可 以 组 合成 一 个 单一 的 推荐 方法 ， 并 对 一 
个 案例 进行 了 研究 ， 描 述 了 一 种 可 能 的 结合 方式 。 

总 体 而 言 ， 情 境 感 知 推荐 系统 (CARS) 是 相对 较 新 ， 且 正在 研究 的 领域 ,还 有 很 多 工 
作 需 要 全 面 开展 。 本 书 建议 了 几 种 未 来 的 研究 方向 。 总 之 ，CARS 包含 许多 有 趣 的 且 有 重 
要 实践 意义 的 研究 型 问题 ， 正 成 为 一 个 新 兴 的 且 有 前 途 的 研究 领域 。 
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摘要 ”推荐 系统 目前 在 商用 和 研究 领域 都 很 流行 ， 在 这 些 领 域 中 已 经 有 很 多 提供 推荐 
的 方法 。 大 部 分 情况 下 ， 如 果 一 个 系统 设计 师 想 要 使 用 推荐 系统 ， 则 必须 在 一 组 候选 方法 
中 做 出 选择 。 选 择 合适 算法 的 第 一 步 是 在 选择 时 决定 着 重 于 应 用 程序 的 哪些 属性 。 的 确 ， 
推荐 系统 包含 许多 可 能 会 影响 用 户 体验 的 属性 ， 如 准确 性 、 健 壮 性 、 可 扩展 性 等 。 本 章 将 
讨论 如 何 根据 应 用 程序 相关 的 属性 来 比较 推荐 系统 。 本 章 将 对 比 研究 作为 重点 ， 通 过 某 些 
评估 指标 对 比 算法 ， 而 不 是 通过 算法 的 绝对 基准 。 本 章 将 描述 合适 于 算法 选择 的 实验 设 
置 。 同 时 考察 三 种 类 型 的 实验 : 首先 进行 离线 设置 的 实验 ， 在 这 个 过 程 中 比较 推荐 技术 时 
无 须 用 户 交 互 ; 然后 是 用 户 调查 实验 ， 即 通过 一 组 受 试 对 象 使 用 系统 并 对 使 用 系统 的 体验 
做 出 报告 ， 最 后 ， 本 章 叙 述 了 大 规模 的 在 线 实 验 ， 在 实验 中 使 用 真正 的 用 户 群 体 与 系统 交 
互 。 在 以 上 的 每 种 情况 中 本 章 将 叙述 不 同类 型 的 可 以 解答 的 问题 ， 并 提供 实验 方案 。 还 描 
述 了 如 何 从 实验 中 得 出 可 信 的 结论 。 然 后 将 仔细 研究 大 量 的 属性 ， 并 根据 给 定 的 属性 解释 
如 何 评估 系统 。 本 书 还 根据 评估 的 上 下 文 属性 概述 了 大 量 的 评估 指标 。 


8.1 简介 


现在 很 多 应 用 里 都 有 推荐 系统 ， 这 些 应 用 为 用 户 展示 大 量 的 物品 。 这 些 系统 一 般 会 为 
用 户 提供 一 个 他 们 可 能 喜欢 的 物品 的 推荐 列表 ， 或 者 预测 用 户 对 每 个 物品 的 偏好 程度 。 同 
时 帮助 用 户 决定 哪些 物品 适合 用 户 ， 减 轻 用 户 从 物品 集合 中 查找 偏好 物品 的 工作 量 。 

例如 ，DVD HHR Netflix9 通 过 显示 在 列 电 影 的 预测 评分 来 帮助 用 户 决 定 租 哪 部 电 
影 。 在 线 图 书 零售 商 Amazon? 提供 在 列 图 书 的 平均 用 户 评 分 ， 以 及 一 个 购买 过 某 本 特定 
书籍 的 用 户 购买 的 其 他 书籍 的 列表 。 微 软 公司 为 用 户 提 供 了 很 多 免费 下 载 ， 如 bug 修复 、 
产品 等 。 当 用 户 下 载 某 个 软件 时 ， 系 统 会 给 出 一 个 补充 软件 列表 一 起 下 载 。 所 有 这 些 系统 
通常 被 归 类 为 推荐 系统 ， 尽 管 它 们 提供 的 服务 不 同 。 

在 过 去 十 年 里 ， 推 荐 系统 领域 已 经 有 了 大 量 的 研究 ， 大 部 分 专注 于 设计 新 的 推荐 算 
法 。 一 个 应 用 程序 设计 者 想 要 为 应 用 添加 推荐 系统 ， 那 么 他 将 有 各 种 各 样 的 算法 可 以 使 
用 ， 而 且 必须 决定 最 适合 目标 的 算法 。 通 常 这 样 的 决定 是 基于 比较 多 个 推荐 系统 性 能 的 实 
验 来 实现 的 。 然 后 ， 在 给 定 的 结构 约束 上 ， 如 类 型 、 实 时 性 、 有 效 数 据 的 可 靠 性 、 可 用 内 
存 以 及 CPU 占用 率 等 ,设计 者 可 以 选 出 性 能 最 好 的 算法 。 另 外 ， 大 部 分 提出 新 算法 的 研 
究 人 员 都 会 将 自己 的 新 算法 与 现 有 的 一 系列 算法 进行 比较 。 通 常 通过 应 用 提供 了 候选 算法 
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排名 (通常 为 数值 分 数 ) 的 评估 指标 进行 这 类 评估 。 

起 初 ， 大 多 数 推荐 系统 基于 准确 率 (准确 预测 用 户 行为 的 能 力 ) 进 行 评估 和 排名 。 然 而 
现在 人 们 普遍 认为 准确 率 固然 重要 ， 但 还 不 足够 部 署 一 个 好 的 推荐 系统 。 在 许多 应 用 中 人 
们 使 用 推荐 系统 不 仅 是 为 了 预测 用 户 品味 的 准确 率 。 同 时 用 户 也 可 能 对 发 现 新 物品 、 迅 速 
发 气 多 样 性 物品 、 隐 私 保护 、 系 统 响应 速度 以 及 其 他 更 多 的 推荐 引擎 的 属性 感 兴 趣 。 所 以 
我 们 必须 识别 出 在 具体 应 用 上 下 文中 哪些 属性 会 影响 推荐 系统 ， 然 后 才能 评估 系统 在 相关 
属性 上 的 运行 性 能 。 

本 章 仔细 研究 了 推荐 系统 的 评估 过 程 ， 讨 论 了 三 种 不 同类 型 的 实验 : 离线 实验 、 用 户 
调查 、 在 线 实验 。 | 

通常 离线 实验 实施 最 简单 ， 该 实验 使 用 现 有 的 数据 和 通过 对 用 户 行为 建 模 来 评估 推荐 
系统 性 能 ， 如 预测 准确 性 。 代 价 较 高 的 选择 是 用 户 调查 ， 其 中 一 小 组 用 户 被 要 求 使 用 系统 
完成 一 系列 任务 ， 通 常 是 事后 回答 一 些 关于 用 户 体验 的 问题 。 最 后 ， 我 们 就 可 以 在 已 经 部 
署 的 系统 上 做 大 量 的 实验 ， 称 为 在 线 实验 。 这 些 实验 基于 未 意识 到 实验 正在 进行 的 真实 用 
户 对 系统 进行 评估 。 本 章 讨论 了 每 种 实验 中 可 以 评估 的 部 分 以 及 不 可 以 评估 的 部 分 。 

我 们 有 时 候 能 够 评估 推荐 系统 完成 总 体 目标 的 情况 。 例 如 ， 可 以 在 电子 商务 网 站 使 用 
和 没有 使 用 推荐 系统 的 情况 下 对 比 其 收入 ， 然 后 估算 推荐 系统 对 该 网 站 的 价值 。 在 其 他 情 
况 下 ， 在 特定 属性 条 件 下 评估 推荐 系统 也 是 很 有 用 的 ， 这 让 我 们 专注 于 改善 那些 具有 不 足 
之 处 的 属性 。 首 先 ， 必 须 证 明 该 属性 确实 与 用 户 相关 且 影 响 着 用 户 体验 。 然 后 ， 我 们 才 可 
以 设计 算法 来 改进 这 些 属 性 。 在 改进 某 个 属性 时 ， 为 了 属性 性 能 的 平衡 ， 有 可 能 会 降低 其 
他 属性 的 性 能 。 在 许多 场景 中 ， 我 们 很 难说 这 些 平 衡 是 如 何 影响 系统 的 整体 性 能 的 ， 这 时 
不 得 不 进行 额外 的 实验 来 验证 或 者 使 用 领域 专家 的 观点 : 

本 章 重点 在 于 推荐 系统 面向 属性 的 评估 。 我 们 对 大 量 的 可 能 影响 推荐 系统 成 败 的 属性 
进行 了 综述 ， 解 释 了 如 何 使 用 这 些 属性 对 候选 推荐 进行 排序 。 对 每 个 属性 进行 三 种 相关 实 
验 :离线 实验 、 用 户 调查 、 在 线 实验 。 并 解释 在 每 种 场景 下 如 何 进行 评估 。 同 时 还 解释 了 
在 评估 每 个 属性 时 遇 到 的 困难 并 概述 了 缺陷 。 假 设 更 好 的 处 理 某 个 属性 能 够 改善 用 户 体 
验 ， 对 于 所 有 这 些 属性 ， 我 们 专注 于 在 该 属性 上 的 推荐 排名 。 

本 章 还 回顾 以 前 评估 推荐 系统 的 建议 ， 这 些 建议 描述 了 大 量 的 流行 方法 ， 并 把 这 些 方 
法 用 在 评估 这 些 属性 的 上 下 文中 。 我 们 专注 于 被 广泛 研究 的 准确 性 和 评估 方法 中 的 排序 指 
标 ， 并 且 描述 了 这 些 属性 的 大 量 的 评价 指标 。 对 于 那些 研究 比较 少 的 属性 ， 我 们 提出 了 方 
法 的 来 源 ， 并 在 适当 的 地 方 提供 了 这 些 方法 具体 实现 的 例子 。 

本 章 剩 下 的 部 分 结构 如 下 ， 在 8.2 节 中 将 讨论 可 以 评估 推荐 系统 的 不 同 实验 设置 以 及 
对 离线 实验 、 用 户 调查 和 在 线 实验 的 适当 使 用 。 同 时 还 概括 了 基于 这 些 实验 做 出 可 靠 决 定 
所 需要 考虑 的 问题 ， 包 括 结果 的 泛 化 及 统计 显著 性 。 在 8. 3 节 ， 我 们 描述 了 大 量 的 可 能 影 
响 推 荐 系统 性 能 的 属性 ， 以 及 这 些 属性 的 评价 指标 。 最 后 ，8. 4 节 进行 总 结 。 


8.2 实验 设置 


本 节 描 述 了 可 以 用 来 对 推荐 进行 对 比 的 三 个 实验 阶段 。 下 面 的 讨论 受到 了 相关 领域 评 
估 方 案 的 影响 ， 如 机 器 学 习 、 信 息 检索 并 强调 那些 和 推荐 系统 有 关 的 部 分 。 详 细 内 容 读 者 
可 参阅 关于 以 上 领域 的 文章 [49，13，60] 。 

我 们 首先 从 离线 实验 设置 开始 ， 通 常 离线 实验 最 容易 执行 ， 因 为 不 需要 与 用 户 交互 。 然 
后 描述 用 户 调查 实验 ， 让 一 组 受 试 对 象 在 受 控 环境 下 使 用 系统 ， 然 后 做 出 体验 报告 。 在 该 实 
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验 阶段 ， 我 们 能 得 到 该 系统 的 定性 和 定量 的 信息 ， 但 是 在 该 实验 设计 阶段 一 定 要 考虑 各 种 各 
样 的 偏差 。 最 终 ， 也 许 最 可 靠 的 实验 便 是 真实 用 户 使 用 该 系统 ， 特 别 还 是 在 不 知情 的 情况 下 。 
虽然 在 该 实验 过 程 中 ， 我 们 只 能 收集 到 某 几 种 数据 ， 但 是 实验 设置 是 最 贴近 现实 世界 的 。 
在 所 有 实验 情景 中 ， 遵 循 如 下 实验 研究 的 几 条 基本 规则 是 很 重要 的 : 
。 假设 : 在 执行 实验 之 前 ， 必 须 形成 一 个 假设 。 该 假设 必须 是 精确 和 严密 的 ， 设 计 
实验 来 验证 这 个 假设 也 是 很 重要 的 。 例 如 ， 假 设 算法 A 预测 用 户 评分 比 算法 B 预 
测 的 更 好 ， 在 该 情况 下 ， 就 应 该 测试 预测 准确 率 而 不 是 其 他 因素 。 
。 变量 控制 ， 当 基于 某 个 假设 来 比较 候选 算法 时 ， 将 所 有 不 被 测试 的 变量 设 为 固定 
值 是 很 重要 的 。 举 例 说 明 ， 如 果 我 们 要 比较 算法 A 和 算法 B 在 电影 评分 上 的 准确 
率 ， 两 者 使 用 不 同 的 协同 过 滤 模 型 。 如 果 我 们 使 用 MovieLens 数据 集训 练 算法 A, 
使 用 Netflix 数据 集训 练 算法 B， 而 且 算 法 A 性 能 优越 ， 但 是 我 们 无 法 判断 这 是 由 
于 CF 模型 的 优越 性 ， 还 是 因为 输入 比较 好 的 数据 ， 或 者 两 者 都 是 。 因 此 我 们 必须 
在 相同 数据 集 上 训练 算法 (或 者 来 自 于 相同 数据 集 的 无 偏差 样本 )， 或 者 为 了 了 解 
性 能 优越 的 原因 ， 在 两 个 不 同 数据 集 上 训练 同一 个 算法 。 
。 泛 化 能 力 : 在 做 实验 总 结 时 ， 我 们 可 能 希望 结论 能 够 不 仅 概 括 当 前 的 实验 。 当 为 
真实 应 用 选择 算法 时 ， 我 们 可 能 希望 自己 的 结论 在 已 部 署 的 系统 中 得 到 保持 ， 并 
且 泛 化 超出 我 们 的 实验 数据 。 同 样 ， 当 开发 新 算法 时 ， 我 们 希望 自己 的 结论 在 实 
验 使 用 的 特定 应 用 和 数据 集 之 外 得 到 保持 。 为 了 增加 结果 泛 化 的 可 能 性 ， 通 常 我 
们 必须 尝试 几 个 数据 集合 应 用 程序 。 了 解 所 使 用 的 各 种 各 样 的 数据 集 的 属性 是 很 
重要 的 。 总 体 来 说 ， 使 用 的 数据 越 多 样 化 ， 结 果 就 越 泛 化 。 


8.2.1 离线 实验 


离线 实验 通过 预先 收集 用 户 选 择 的 或 者 打 过 分 的 物品 的 数据 集 来 进行 实验 。 使 用 该 数 
据 集 我 们 可 以 尝试 模拟 用 户 与 推荐 系统 的 交互 行为 。 在 这 种 情况 下 ， 假 设 在 收集 数据 时 的 
用 户 行为 与 推荐 系统 部 署 后 的 用 户 行为 是 足够 相似 的 ， 因 此 我 们 可 以 基于 模拟 做 出 可 靠 的 
决策 。 离 线 实 验 是 很 有 吸引 力 的 ， 因 为 不 需要 真实 用 户 的 参与 ， 这 样 可 以 在 低 成 本 的 情况 
下 比较 大 量 的 算法 。 离 线 实验 的 不 足 之 处 是 能 够 回答 问题 的 范围 较 小 ， 具 有 代表 性 的 是 关 
于 算法 预测 性 能 的 问题 。 特 别 是 ， 我 们 必须 假设 与 系统 进行 交互 的 用 户 行为 已 经 通过 在 系 
统 部 署 之 前 的 用 户 行为 进行 了 恰当 的 模拟 ， 其 中 包括 推荐 系统 的 选择 。 因 此 ， 不 能 在 此 阶 
段 直接 评估 推荐 对 用 户 行为 的 影响 。 

因此 ， 离 线 实验 的 目的 是 过 滤 不 恰当 的 方法 ， 为 成 本 比较 大 的 用 户 调查 和 在 线 实 验 提 
供 相对 较 小 的 算法 候选 集 进 行 测试 。 在 此 过 程 中 的 一 个 典型 例子 是 在 离线 实验 阶段 调 优 算 
法 参数 ， 这 样 在 进行 下 个 阶段 时 ， 算 法 就 具有 最 优 的 参数 。 
8.2.1.1 离线 实验 数据 集 


由 于 离线 实验 的 目的 是 过 滤 算 法 ， 那 么 离线 评估 所 使 用 的 数据 应 该 与 设计 者 期 望 推荐 
系统 在 线 部 署 后 所 面临 的 数据 尽 可 能 地 匹配 。 而 且 必须 确保 所 选 的 用 户 、 物 品 和 评分 的 分 
布 没有 偏 置 。 例 如 ， 在 这 样 的 情况 下 ， 数 据 从 现 有 的 推荐 系统 (或 者 一 个 没有 推荐 功能 的 
系统 ) 中 获得 ， 实 验 设置 者 为 了 降低 实验 成 本 ， 可 能 会 尝试 通过 剔除 计数 较 低 的 用 户 和 物 
品 对 数据 进行 预 过 滤 。 如 果 这 样 做 ， 实 验 者 应 该 注意 到 这 水 及 一 个 权衡 ,因为 这 为 数据 引 
进 了 系统 性 偏差 。 如 果 必 要 ， 对 用 户 和 物品 进行 随机 取样 是 一 个 减少 数据 的 不 错 的 方法 ， 
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虽然 这 也 可 能 引进 别 的 偏差 到 实验 中 (例如 ， 这 可 能 会 对 能 够 很 好 处 理 稀 朴 数据 的 算法 更 
有 利 )。 有 时 ， 已 知 的 数据 偏差 可 以 通过 如 重新 加 权 数 据 来 纠正 ， 但 纠正 数据 中 的 偏差 是 
件 很 困难 的 事情 。 

另 一 个 偏差 的 来 源 可 能 来 自 于 数据 集 本 身 。 例 如 ， 某 些 用 户 可 能 比较 喜欢 给 自己 有 强 
烈 观点 的 物品 打分 ， 有 些 用 户 的 评分 比 其 他 用 户 多 。 因 此 ， 有 明确 评分 的 项 目 集 可 能 因 评 
分 本 身 使 其 具有 偏差 [38]。 再 一 次 ， 人 
纠正 这 些 偏差 。 
8.2.1.2 模拟 用 户 行 为 


为 了 离线 评估 算法 ， 必 须 模拟 系统 预测 和 推荐 、 用 户 纠正 预测 和 使 用 推荐 的 在 线 过 程 。 
该 过 程 通常 通过 记录 用 户 历史 数据 ， 然 后 隐藏 某 些 交互 来 模拟 用 户 如 何 为 一 个 物品 打分 ， 或 
者 用 户 会 单 击 哪些 推荐 来 实现 。 有 很 多 方法 可 以 用 来 选择 被 评分 或 被 选择 的 物品 进行 隐藏。 
再 次 ， 在 做 选择 时 比较 可 取 的 方法 是 尽 可 能 接近 地 模拟 实际 目标 。 但 是 ， 在 许多 场景 中 ， 我 
们 受到 评估 方法 计算 成 本 的 限制 ， 而 且 为 了 在 大 型 数据 集 上 进行 实验 必须 做 出 妥协 。 

理想 情况 下 ， 假 设 系统 在 收集 数据 时 一 直 是 运行 的 ， 如 果 我 们 能 够 访问 用 户 选择 物品 
的 时 间 戳 ， 那 么 我 们 就 可 以 模拟 推荐 系统 的 预测 。 开 始 时 我 们 没有 可 用 的 先 验 数 据 来 计算 
预测 ， 可 以 通过 用 户 选择 的 时 间 顺 序 和 步骤 去 尝试 预测 每 一 个 选择 ， 并 使 得 该 预测 可 用 在 
将 来 的 预测 中 。 对 于 大 型 数据 集 ， 一 个 简单 的 方法 是 随机 抽样 ， 对 用 户 操作 之 前 的 时 间 进 
行 抽样 ， 在 用 户 操作 之 后 隐藏 所 有 选择 (所 有 用 户 的 选择 ) ， 然 后 尝试 推荐 物品 给 该 用 户 。 
该 方法 需要 更 改 推荐 前 的 数据 ， 计 算 开 销 是 相当 昂贵 的 。 

一 个 代价 比较 小 的 选择 是 对 测试 用 户 进行 抽样 ， 然 后 抽取 单一 的 测试 时 间 ， 在 测试 时 
间 过 后 对 每 个 测试 用 户 隐藏 所 有 物品 。 这 个 过 程 模拟 了 这 样 一 个 场景 ， 推 荐 系统 是 在 测试 
时 建立 的 ， 而 且 在 进行 推荐 时 不 考虑 测试 结束 后 获得 的 新 数据 。 另 一 个 选择 就 是 为 每 个 测 
试用 户 抽样 一 个 测试 时 间 ， 测 试 时 间 过 后 隐藏 测试 用 户 的 物品 ， 不 保持 用 户 的 时 间 一 致 
性 。 这 种 选择 实际 上 假设 物品 选择 的 顺序 是 重要 的 而 不 是 做 出 选择 的 绝对 时 间 。 最 后 一 个 
选择 就 是 忽略 时 间 。 我 们 先 抽样 一 组 测试 用 户 ， 然 后 抽样 选取 对 每 个 用 户 a 隐藏 的 物品 的 
数目 n。， 最 后 抽样 n. 个 需要 隐藏 的 物品 。 这 是 假设 用 户 选 择 的 时 间 因 素 是 不 重要 的 。 如 
果 用 户 操作 的 时 间 惟 是 未 知 的 ， 我 们 只 能 强行 这 种 假设 。 后 面 的 三 种 方法 ， 将 数据 分 成 了 
单一 的 训练 数据 和 单一 的 测试 数据 。 在 给 定 的 约束 下 ， 为 领域 和 感 兴趣 的 任务 (请 参照 第 
11 章 ) 选 择 一 个 最 合适 而 不 是 最 方便 的 方法 。 

在 很 多 研究 论文 中 常用 的 方法 是 ， 使 用 固定 数目 的 已 知 物品 以 及 每 个 测试 用 户 的 固定 
数目 的 隐藏 物品 (所 谓 的 “给 定 we 或 者 “除去 ”个 之 外 所 有 的 "方法 ) 。 这 个 方案 在 分 析 判 断 
算法 并 确定 在 哪些 情况 下 算法 表现 好 时 很 有 用 。 然 而 ， 当 我 们 想 要 决定 在 我 们 的 应 用 程序 
中 使 用 哪 种 算法 时 ， 必 须 扣 心 自问 ， 是 否 真 的 只 为 那些 正好 已 经 标记 了 个 物品 的 用 户 展 
示 推 荐 还 是 那些 预计 继续 给 个 商品 打分 的 用 户 。 如 果 并 不 是 这 样 的 情况 ， 那 么 用 这 些 方 
法 计算 出 来 的 结果 是 有 偏差 的 ， 使 得 预测 算法 在 线 行为 不 可 靠 。 
8.2.1.3 更 复杂 的 用 户 模型 

以 上 我 们 所 讨论 的 所 有 方法 对 用 户 的 行为 进行 了 一 些 假设 ， 这 些 行为 在 某 些 特定 的 应 
用 程序 中 可 以 作为 用 户 模型 。 虽 然 只 讨论 了 很 简单 的 用 户 模型 ， 但 有 时 可 能 需要 更 复杂 些 
的 用 户 行为 模型 [37]。 采 用 先进 的 用 户 模型 可 以 模拟 用 户 与 系统 的 交互 ， 从 而 减少 昂贵 的 
用 户 调查 和 在 线 实验 的 开销 。 然 而 在 设计 用 户 模型 时 必须 注意 : 第 一 ， 用 户 建 模 很 难 ， 在 
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这 方面 业界 有 大 量 的 研究 (如 文献 [15]) 。 第 二 ， 当 用 户 模型 不 准确 时 ， 我 们 可 能 在 优化 一 
个 模拟 性 能 与 实际 性 能 毫 不 相关 的 系统 。 虽 然 设计 一 个 使 用 复杂 用 户 模型 的 算法 进行 推荐 
是 合理 的 ， 但 是 对 使 用 这 样 复 杂 难 以 验证 的 用 户 模 型 来 验证 的 实验 要 谨慎 。 


8.22 ” 用户 调 查 


许多 推荐 方法 依赖 于 用 户 和 系统 的 交互 (参照 第 23、13、6 章 )。 模 拟 一 个 可 靠 的 用 户 
与 系统 交互 很 难 ， 因 此 离线 测试 很 难 执行 。 为 了 合理 地 评估 这 种 系统 ， 必 须 收集 真实 用 户 
与 系统 的 交互 。 一 旦 当 离 线 测 试 是 可 行 的 ， 真 实用 户 的 交互 还 可 以 提供 关于 系统 性 能 的 其 
他 信息 。 在 这 种 情况 下 ， 我 们 通常 会 进行 用 户 调查 。 

用 户 调查 是 由 招聘 一 组 测试 对 象 ， 并 要 求 他 们 执行 一 些 需 要 与 系统 进行 交互 的 任务 来 
进行 的 。 在 受 试 对 象 执行 任务 时 ， 我 们 观察 记录 他 们 的 行为 ， 收 集 任意 数量 的 量 评测 方 
法 ， 例 如 ， 完 成 了 任务 的 哪些 部 分 ， 任 务 结果 的 准确 性 ， 或 者 执行 任务 的 时 间 。 在 任务 完 
成 之 前 、 期 间 、 之 后 的 情况 下 我 们 可 以 提出 许多 定性 问题 。 这 些 问 题 可 以 帮助 收集 一 些 不 
能 直接 观测 到 的 数据 ， 例 如 ， 受 试 对象 是 否 喜 欢 用 户 界面 ， 或 者 用 户 觉得 完成 任务 是 否 轻 
松 。 一 个 典型 的 实验 例子 是 测试 推荐 算法 对 新 闻 故 事 浏览 行为 的 影响 。 在 该 例子 中 ， 受 试 
对 象 阅读 一 组 他 们 感 兴趣 的 故事 ， 这 些 故事 可 能 包含 相关 的 推荐 也 可 能 不 包含 。 然 后 我 们 
可 以 确认 推荐 是 否 被 使 用 ， 有 推荐 和 无 推荐 时 人 们 阅读 的 故事 是 否 不 同 。 可 以 收集 数据 ， 
例如 ， 某 个 推荐 的 单 击 次 数 ， 其 至 在 某 些 情况 下 ， 追 踪 眼 球 运动 来 观察 受 试 对 象 是否 看 过 
该 推荐 。 最 后 ， 我 们 可 以 提出 一 些 定性 问题 ， 如 受 试 对 象 是 否认 为 这 些 推 荐 是 相关 的 。 

当然 ， 在 许多 其 他 领域 用 户 调查 是 核心 工具 ， 因 此 在 用 户 调查 的 合理 设计 方面 有 很 多 
文献 。 该 章节 只 概览 了 通过 用 户 调查 评估 推荐 系统 时 应 该 考虑 的 基本 条 件 ， 感 兴趣 的 读者 
可 以 在 其 他 章节 找到 更 深入 的 讨论 (如 文献 L5]) 。 
8.2.2.1 优点 和 缺点 


用 户 调查 或 许 能 回答 我 们 研究 的 三 个 实验 设置 的 大 部 分 问题 。 不 同 于 离线 实验 ， 该 设 . 
置 允许 我 们 测试 用 户 与 系统 交互 时 的 行为 ， 以 及 推荐 对 用 户 行为 的 影响 。 在 离线 情况 下 的 
用 户 调 查 测试 中 ， 通 常会 做 出 如 “给 定 相 关 的 推荐 ， 用 户 很 可 能 会 使 用 ”这 样 的 假设 。 同 
样 ， 这 是 唯一 一 个 设置 允许 我 们 收集 定性 数据 ， 这 对 于 解释 量化 结果 是 至 关 重 要 的 。 

同时 ， 我 们 通常 可 以 在 该 设置 中 收集 大 量 的 量化 方法 ， 因 为 可 以 近 距 离 地 监视 用 户 执 
行 任务 。 然 而 用 户 调查 也 有 一 些 缺 陷 。 首 先 ， 用 户 调查 执行 代价 昂贵 ， 招 莫大 量 的 受 试 对 
象 并 要 求 他 们 执行 足够 量 的 任务 ， 要 么 会 花费 大 量 的 时 间 ， 如 果 受 试 对 象 是 志愿 者 ; BA 
会 开销 很 大 ， 如 果 受 试 对 象 是 付费 雇佣 。 因 此 ， 通 常 我 们 必须 限制 在 一 小 组 受 试 对 象 及 一 
组 相对 较 小 的 任务 集 ， 而 且 不 能 测试 所 有 可 能 的 情况 。 此 外 ， 为 得 到 可 靠 的 结果 ， 每 种 情 
况 都 必须 重复 几 次 ， 这 就 更 进一步 地 限制 了 可 测试 的 不 同 任务 的 范围 。 

由 于 这 些 实验 执行 代价 昂贵 ， 我 们 应 该 在 尽 可 能 低 的 粒度 下 收集 尽 可 能 多 的 数据 。 这 
将 允许 我 们 以 后 详细 地 研究 实验 结果 ， 分 析 实 验 之 前 不 明显 的 条 件 。 该 指南 可 以 帮助 我 们 
减少 为 收集 忽略 的 评测 方法 所 需 的 连续 实验 。 

另外 ， 为 了 避免 实验 失败 ， 例 如 ， 由 于 某 些 用 户 行为 导致 程序 出 错 ， 研 究 人 员 通 常会 
进行 试点 用 户 调查 。 这 种 实验 都 是 小 型 实验 ， 不 是 为 了 收集 统计 数据 ， 而 是 为 了 测试 系统 
漏洞 和 故障 。 在 某 些 情况 下 ， 这 些 试点 研究 结果 被 用 来 改善 推荐 。 如 果 是 这 样 ， 那 么 试点 
结果 成 为 "污点 ”， 在 最 终 用 户 调查 计算 评测 方法 时 不 应 使 用 。 
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另 一 个 重要 的 考虑 是 测试 对 象 必须 尽 可 能 地 贴近 真实 系统 的 用 户 群 。 例 如 ， 如 果 系 统 
是 为 推荐 电影 而 设计 的 ， 那 么 在 狂热 电影 迷 上 的 研究 结果 或 许 并 不 能 覆盖 整个 人 口 BA 
题 经 常 出 现在 研究 参与 者 是 自愿 者 ， 因 为 在 此 情况 下 ， 原 本 对 应 用 更 感 兴趣 的 人 会 更 容易 
成 为 志愿 者 。 

然而 ， 即 使 受 试 对 象 正好 代表 了 真正 的 用 户 群 ， 结 果 依 然 可 能 有 偏差 ， 因 为 他 们 被 告 
知 在 参加 一 个 实验 。 例 如 ， 众 所 周知 付费 的 受 试 对 象 会 倾向 于 尝试 迎合 执行 实验 的 人 或 公 
司 。 如 果 受 试 对 象 知道 要 测试 的 假设 ， 他 们 可 能 会 下 意识 地 提供 支持 该 假设 的 证 据 。 为 了 
调节 这 一 点 ， 在 收集 数据 之 前 最 好 不 要 透露 实验 目的 。 另 外 ， 受 试 对 象 的 报酬 根据 他 们 选 
择 的 物品 采取 完全 或 部 分 补贴 时 ， 出 现 了 另外 一 个 更 加 微妙 的 效果 。 在 系统 最 终 用 户 的 补 
贴 不 同 的 情况 下 ， 数 据 可 能 出 现 偏差 ， 因 为 当 付 全 价 时 用 户 的 选择 和 偏好 可 能 不 同 。 
8.2.2.2 受 试 对 象 间 与 受 试 对 象 内 

由 于 通常 用 户 调查 要 比较 几 个 候选 方法 ， 每 个 候选 方法 必须 在 相同 任务 上 进行 测试 。 
为 测试 所 有 候选 方法 ， 我们 可 以 在 受 试 对 象 间 比较 候选 方法 ， 将 每 个 受 试 对 象 分 配 到 一 个 
候选 方法 进行 实验 ， 或 者 在 受 试 对 象 内 比较 候选 方法 ， 每 个 受 试 对 象 在 不 同 的 任务 上 测试 
一 组 候选 方法 [20]。 . 

通常 受 试 对 象 内 实验 可 提供 更 多 的 信息 ， 因 为 在 候选 方法 之 间 进 行 有 偏差 的 用 户 分 割 
不 能 说 明 一 个 方法 的 优越 性 。 在 该 设置 中 可 能 会 提出 关于 不 同 候选 方法 的 比较 问题 ， 比 
如 ， 受 试 对 象 更 喜欢 哪个 候选 方法 。 然 而 ， 这 类 测试 用 户 更 能 意识 到 实验 的 存在 ， 使 得 隐 
藏 候选 方法 间 的 不 同 更 加 困难 。 

受 试 对 象 间 实验 ， 也 称 为 A-B 测试 (All Between) ， 提 供 的 设置 更 贴近 真实 系统 ， 即 
因为 每 个 用 户 实 验 都 有 一 个 单独 的 系统 。 这 样 的 实验 也 可 以 测试 使 用 系统 的 长 期 效果 ， 因 
为 用 户 无 须 更 换 系 统 。 因 此 我 们 可 以 检验 用 户 是 如 何 适 应 系统 的 ， 然 后 估计 一 个 专业 的 学 
习 曲 线 。 
8.2.2.3 变量 调节 

正如 上 面 所 述 ， 控 制 所 有 没有 进行 专门 测试 的 变量 是 重要 的 。 然 而 ， 要 将 几 个 候选 方 
法 的 输出 显示 给 受 试 者 ， 正 如 受 试 对 象 内 实验 一 样 ， 我 们 必须 调节 几 个 变量 。 

为 受 试 对 象 显示 结果 时 ， 可 以 是 顺序 地 或 者 混合 地 。 两 种 情况 中 都 有 某 些 偏 差 需要 校 
正 。 将 结果 顺序 显示 时 ， 之 前 看 到 的 结果 会 影响 用 户 对 现在 结果 的 看 法 。 例 如 ， 如 果 显 示 
之 前 的 结果 看 起 来 不 合适 ， 那 么 后 面 显 示 的 结果 就 可 能 看 起 来 要 比 实际 上 好 。 在 展示 两 组 
结果 时 ， 由 于 位 置 不 同 可 能 会 产生 某 些 偏差 。 例 如 ， 来 自 许 多 文化 背景 的 用 户 趋向 于 从 左 
至 右 、 从 上 到 下 地 查看 结果 。 因 此 ， 用 户 可 能 优先 看 到 显示 在 上 面 的 结果 。 

校正 这 种 未 测试 变量 的 一 个 常用 方法 是 拉丁 方 L5] 过 程 。 该 程序 每 次 将 各 种 结果 的 位 
置 随机 化 ， 从 而 抵消 了 由 未 测试 变量 带 来 的 偏差 。 
8.2.2.4 调查 问 着 | 

用 户 调查 允许 我 们 使 用 强大 的 调查 问卷 工具 。 在 受 试 对 象 执行 任务 之 前 、 期 间 和 之 后 
我 们 都 可 以 问 他 们 一 些 体验 问题 。 这 些 问题 可 以 提供 一 些 很 难 评测 的 属性 的 信息 ， 如 受 试 
对 象 的 心理 状态 ， 或 者 受 试 对 象 是 否 喜 欢 该 系统 。 

这 些 问题 在 提供 有 价值 信息 的 同时 也 会 提供 误导 信息 。 提 出 不 需要 “正确 ”答案 的 中 立 
问题 是 很 重要 的 。 受 试 对 象 回答 也 可 能 不 真实 ， 比 如 ， 他 们 认为 答案 是 隐私 的 ， 或 者 他 们 
认为 真实 的 答案 会 让 他 们 不 讨 人 喜欢 。 
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其 实 ， 在 其 他 的 领域 有 大 量 的 关于 调查 问卷 编写 艺术 的 研究 ， 详 细 内 容 读者 可 以 参考 
文献 [46] 。 


8.2.3 在 线 评估 


在 许多 实际 推荐 应 用 程序 中 ， 系 统 设 计 者 希望 可 以 影响 用 户 的 行为 。 因 此 我 们 对 评测 
用 户 与 不 同 推荐 系统 互动 时 的 行为 变化 感 兴趣 。 例 如 ， 在 其 他 条 件 相 同 的 情况 下 ， 如 果 一 
个 系统 的 用 户 经 常 接纳 推荐 ， 或 者 在 同等 条 件 下 从 一 个 系统 用 户 收集 的 效用 超过 从 另 一 个 
系统 用 户 收集 的 效用 ， 那 么 我 们 就 可 以 说 一 个 系统 优 于 另 一 个 系统 。 

推荐 系统 的 实际 效果 取决 于 许多 因素 ， 例 如 ， 用 户 的 意图 (他 们 需要 何 种 具体 的 信息 ， 
他 们 在 寻求 多 大 的 新 颖 性 与 多 大 的 风险 )， 用 户 上 下 文 (他 们 已 经 熟悉 哪些 物品 ， 他 们 有 多 
信任 该 系统 )， 推 荐 显示 的 界面 。 

因此 ， 为 系统 真实 价值 提供 强 有 力 证 据 的 实验 是 在 线 评估 ， 期 间 真 实用 户 使 用 系统 执 
行 真实 的 任务 。 对 比 几 个 在 线 系统 是 最 可 靠 的， 获取 不 同系 统 的 排名 ， 而 不 是 难以 解释 的 
绝对 数字 。 

出 于 该 原因 ， 许 多 实际 系统 采用 能 够 比较 多 个 算法 的 在 线 测试 系统 L32]。 通 常 ， 这 种 
系统 将 一 小 部 分 浏览 重 定向 到 不 同 的 推荐 引擎 ， 然 后 记录 用 户 与 不 同系 统 之 间 的 交互 。 

进行 这 种 测试 时 必须 考虑 几 点 因素 。 例 如 ， 对 用 户 随 机 抽样 ( 重 定向 ) 是 很 重要 的 ， 只 
有 这 样 方法 的 比较 才 公 平 。 选 出 推荐 的 不 同方 面 同 样 重要 。 例 如 ， 如 果 我 们 关心 的 是 算法 
的 准确 度 ， 那 么 用 户 界面 保持 一 致 是 很 重要 的 。 相 反 如 果 我 们 把 重点 放 在 更 好 的 用 户 界 面 
上 ， 那 么 底层 算法 最 好 保持 一 致 。 

在 某 些 情况 下 ， 这 样 的 实验 是 有 风险 的 。 例 如 ， 一 个 提供 不 相关 推荐 的 测试 系统 可 能 
会 阻止 测试 用 户 再 次 使 用 真实 系统 。 因 此 ， 实 验 对 系统 会 有 负面 影响 ， 这 可 能 是 商业 应 用 
程序 无 法 接受 的 。 

由 于 上 述 原 因 ， 在 线 评估 测试 最 好 运行 在 证 明 候选 方法 是 合理 的 大 量 离 线 研究 或 者 评测 
用 户 对 系统 态度 的 用 户 调查 之 后 。 这 个 循序 渐进 的 过 程 减少 了 引起 用 户 严 重 不 满 的 风险 。 

在 线 评估 的 独特 之 处 在 于 允许 对 系统 目标 进行 直接 评测 。 例 如 ， 长 期 利润 和 用 户 留 
存 。 因 此 ， 可 以 用 来 推断 系统 属性 是 如 何 影响 整体 目标 的 ， 例 如 ， 推 荐 准确 性 、 多 样 性 ， 
还 可 以 用 来 理解 属性 之 间 的 平衡 。 然 而 ， 由 于 将 这 些 不 同 的 属性 独立 是 很 难 的 ， 再 加 上 在 
线 比较 算法 代价 昂贵 ， 很 难 对 这 些 关系 获得 一 个 全 面 完 整 的 判断 。 


8.2.4 得 出 可 靠 结论 


在 任何 类 型 的 实验 中 ， 能 够 确信 候选 推荐 对 于 系统 将 来 面临 的 未 知 数据 仍 是 一 个 好 的 
选择 ， 这 是 很 重要 的 。 正 如 我 们 之 前 所 解释 的 ， 为 了 最 佳 地 模拟 在 线 应 用 ， 我 们 应 该 谨慎 
地 选择 离线 实验 的 数据 和 用 户 调查 中 的 受 试 对 象 。 然 而 仍然 有 这 样 的 可 能 性 ， 在 这 个 测试 
集 上 性 能 好 的 算法 在 另 一 个 测试 集 上 性 能 也 很 好 ， 因 为 实验 恰巧 适合 该 算法 。 为 减少 这 种 
统计 错误 的 可 能 性 ， 必 须 对 结果 进行 显著 性 检验 。 
8.2.4.1 置信 度 和 p 值 


显著 性 检验 的 一 个 标准 工具 是 显著 性 水 平和 值 一 一 因 幸 运 而 获得 结果 的 概率 。 通 
常 ， 我 们 拒绝 零 假设 ， 即 如 果 p 值 超过 某 一 阐 值 那么 算法 A 并 不 比 算法 B 好 。 也 就 是 如 
果 排 名 是 在 超过 阅 值 的 情况 下 观察 得 到 的 ， 那么 该 实验 结果 并 不 重要 。 习 惯 上 ， 取 p= 
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0.05 作为 阔 值 ， 也 就 是 置信 和 度 小 于 95%。 在 错误 选择 的 代价 较 高 的 情况 下 可 以 使 用 更 严 
格 的 显著 性 水 平 (如 0.01 或 者 更 低 ) 。 


8.2.4.2 配对 结果 


为 了 显著 检验 来 证 明 算 法 A 确实 优 于 算法 B， 我 们 通常 使 用 几 个 独立 实验 的 结果 来 比 
较 算 法 A 和 算法 B。 事 实 上 ， 我 们 曾 提出 的 生成 测试 数据 的 方法 (8. 2. 1. 2 节 ) 能 使 我 们 得 
到 这 样 一 组 结果 。 假 设 测试 用 户 是 从 一 些 人 中 独立 抽取 的 ， 对 每 个 测试 用 户 进行 算法 性 能 
评估 会 使 我 们 得 到 所 需 的 独立 比较 。 然 而 ， 当 为 同一 个 用 户 进行 多 物品 推荐 或 预测 时 ， 结 
果 中 单 物品 性 能 指标 不 可 能 独立 。 因 此 ， 最 好 以 单 用 户 为 基础 进行 算法 比较 。 

对 算法 A 和 算法 B. 进行 这 种 单 用户 配 对 性 能 评测 ， 有 一 个 简单 的 显著 检验 方法 符号 
检验 [13]。 计 数 算法 A 优 于 算法 B 的 用 户 数 BCna) 和 算法 B 优 于 算法 A 的 用 户 数 A Qu. 
显著 性 水 平 即 A 不 真正 优 于 B 的 概率 ， 估 计 至 少 有 na/ (na 十 ns)0.5 的 概率 二 项 式 实验 成 
功 ( 如 公平 掷 硬 币 有 na/ (na 十 na) 概率 硬币 朝 上 )， 由 下 式 给 出 : 


= T n! 
p = (0.5) 之 inci (8.1) 


符号 检验 的 简单 性 以 及 缺少 对 分 布 情况 的 假设 使 得 它 是 个 不 错 的 选择 。 虽 然 用 户 数 相 
同 通常 会 被 忽略 ， 但 Demsar[13] 建 议 将 它们 平均 分 配给 算法 A 和 算法 B， 因 为 零 假设 得 
到 验证 即 算法 差异 不 显著 。 当 n +n 很 大 时 ， 我 们 可 以 通过 正 态 分 布 利用 大 样本 理论 进 
行 近似 式 (8. 1) 。 然 而 ， 在 强大 的 现代 计算 机 条 件 下 ， 这 通常 是 没 必要 的 。 一 些 作 者 (如 文 
献 [49]) 使 用 名 词 McNemar’s test 来 表示 对 两 边 符号 检验 使 用 xX” 近似 。 

注意 ， 有 时 即使 系统 B 的 性 能 优 于 系统 A 的 性 能 ， 符 号 检验 可 能 会 显示 系统 A 优 于 
系统 B 的 概率 很 高 。 这 种 情况 发 生 在 系统 B 的 性 能 偶尔 压倒 性 优 于 系统 A。 因 此 ， 这 个 看 
似 不 一 致 的 结果 是 由 于 只 测试 了 一 个 系统 优 于 另 一 个 系统 的 概率 ， 而 没有 考虑 差异 梯度 。 

. 符号 检验 可 以 扩展 到 那些 我 们 想 知道 一 个 系统 优 于 另 一 个 系统 的 概率 的 值 的 情况 。 例 
如 ， 假 设 系统 A 比 系统 B 资源 更 加 密集 ， 而 且 只 有 在 优 于 系统 B 一 定量 时 才 值 得 部 署 。 
我 们 将 符号 检验 中 的 “成 功 ” 定 义 为 A 以 一 定数 量 优 于 B， 找 到 A 并 不 真正 以 该 数量 优 于 B 
的 概率 作为 式 (8. 1) 里 的 p 值 。 

一 个 常用 的 考虑 差异 梯度 的 检验 是 配对 学 生 t 检验 ， 该 检验 着 眼 于 算法 A 和 算法 也 
性 能 分 数 的 平均 差异 ， 使 用 差异 分 数 的 标准 差 进 行 归 一 化 。 使 用 该 检验 需要 不 同 用 户 的 分 
数 差异 是 可 比 的 ， 这 样 平均 这 些 差异 才 是 合理 的 。 对 于 少数 用 户 ， 检 验 的 有 效 性 还 取决 于 
正 态 分 布 的 差异 。Demsar[13] 指 出 当 样 本 量 很 小 时 该 假设 是 很 难 验 证 的 ，t 检验 对 异常 值 
敏感 。 他 推荐 使 用 Wilcoxon 符号 秩 检验 ， 与 c 检验 相似 ， 使 用 算法 A MB 间 的 差异 梯度 ， 
但 在 差异 上 不 做 分 布 假设 。 然而， 使 用 Wilcoxon 符号 秩 检验 依然 需要 两 个 系统 的 差异 在 
用 户 间 是 可 比 的 。 

另 一 个 提高 结论 显著 性 的 方法 是 使 用 大 数据 集 。 在 离线 情况 下 ， 需 要 使 用 较 小 的 训练 
集 ， 可 能 导致 一 个 不 能 代表 在 部 署 后 可 用 的 训练 数据 数量 的 实验 性 协议 。 在 用 户 调查 中 这 意 
味 着 额外 的 开销 。 在 线 测试 中 ， 增 加 为 算法 收集 的 数据 需要 长 时 间 试 用 或 者 少量 算法 比较 的 
额外 开销 。 i 
8.2.4.3 非 配对 结果 

上 述 测试 适合 观察 值 是 成 对 的 情况 。 也 就 是 说 每 个 算法 在 每 个 测试 用 例 上 运行 ， 正 如 
离线 测试 时 一 样 。 而 在 线 测试 中 ， 通 常用 户 被 分 配 到 一 个 或 者 另 一 个 算法 上 ， 这 样 两 个 算 
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法 就 不 会 在 相同 测试 用 例 上 进行 评估 。 在 此 情况 下 Mann-hitney 检验 是 Wilcoxon 检验 的 一 
个 扩展 。 假 设 算法 A 结果 为 za， 算 法 B 结果 为 ns。 

这 两 个 算法 的 性 能 评估 被 汇集 排序 ， 以 使 得 最 好 的 结果 排 在 最 前 ， 最 差 的 排 在 最 后 。 
相同 结果 的 排序 被 平均 。 例 如 ， 如 果 第 二 至 第 五 名 相同 ， 排 名 都 为 3. 5。Mann-Whitney 
检验 计算 了 零 假设 概率 ， 即 从 nn 十 ns 中 随机 选择 结果 至 少 要 与 从 算法 A 的 结果 na 选择 结 
果 的 平均 排名 一 样 好 。 


概率 可 以 通过 列举 所 有 Sa za 个 选择 以 及 计算 可 以 达到 所 需 平均 排名 的 选择 进行 
精确 计算 ， 或 者 通过 重复 n 个 结果 重复 取样 来 近似 。 当 n Mns 足够 大 时 (一 般 超 过 5), 
从 满足 零 假设 的 mw 十 ms 池 中 随机 选择 的 nA 结果 的 平均 排名 的 分 布 可 使 用 期 望 为 序 (n4 十 


ns 十 1 以 及 标准 方差 为 /二 旦 (ns 十 ns 十 1) 的 高 斯 分 布 进行 近似 。 因 此 ， 我 们 可 以 通过 减 


di Qu Ems ED BERE, [3524 Qn en HD HK LR A A 的 na 结果 的 平均 排名 ， 在 


该 值 上 评估 标准 高 斯 CDF 并 得 到 该 检验 的 p 值 。 
8.2.4.4 多 重 测试 


另外 一 个 要 考虑 的 重要 因素 ， 主 要 是 在 离线 情况 下 ， 即 评估 算法 的 多 个 版 本 的 效果 。 例 
如 ， 实 验 者 可 能 会 尝试 一 个 新 的 推荐 算法 的 多 个 变 体 ， 并 与 基准 算法 进行 比较 ， 直 到 找到 一 
个 算法 通过 p—0.05 的 符号 检验 ， 从 而 推断 他 们 的 算法 在 基准 算法 上 提高 了 95% 的 置信 和 度 。 
然而 ， 这 并 不 是 一 个 有 效 的 推断 。 假 设 实验 者 评估 了 10 个 变 体 ， 而 他 们 全 部 在 统计 上 与 基 
准 相同 。 如 果 任 何其 中 一 个 实验 错误 地 通过 了 符号 检验 的 概率 为 90.05, ABA 10 个 实验 中 
至 少 一 个 实验 错误 地 通过 符号 检验 的 概率 为 1 一 (1 一 0.05)10=0. 40。 该 风险 俗称 “测试 集 调 
优 "”， 可 以 通过 将 测试 用 户 分 为 两 部 分 一 一 一 个 研究 ( 调 优 ) 集 和 一 个 评估 集 来 避免 。 基 于 研 
究 集 选择 算法 ， 选 择 的 有 效 性 通过 在 评估 集 上 运行 显著 性 检验 来 评测 。 

为 许多 算法 进行 排序 时 存在 同样 的 担忧 ， 但 更 加 难以 避免 。 假 设 最 好 的 N 十 1 个 算法 
是 在 研究 集中 选择 的 ， 为 得 到 使 得 选择 的 算法 确实 为 最 好 算法 的 置信 度 1 一 p， 那 么 它 必 
须 在 评估 集中 优 于 其 他 N 个 算法 ， 且 显著 性 为 1 一 (1 一 如 )%"。 这 就 是 著名 的 Bonferroni 
校正 法 ， 应 该 用 在 配对 显著 性 检验 被 多 次 使 用 时 。 另 外 的 方法 如 方差 分 析 或 者 弗 里 德 曼 检 
验 ， 是 学 生 上 检验 和 Wilcoxon 符号 秩 检验 的 泛 化 。 方 差分 析 对 不 同 算法 性 能 检验 的 正 态 
性 及 其 差异 的 关系 做 出 强 假设 。 这 里 推荐 读者 阅读 文献 [13] 对 以 上 或 其 他 多 重 算法 排序 测 
试 进行 深入 研 究 。 ，， 
”“” 当 使 用 多 种 方法 比较 一 对 算法 时 会 产生 更 加 微妙 的 担忧 。 例 如 ， 对 比 两 个 算法 时 可 能 
会 用 到 许多 准确 率 评测 方法 和 覆盖 率 评测 方法 等 。 即 使 两 个 算法 在 所 有 评测 下 相同 ; 找到 
一 个 评测 方法 使 得 一 个 算法 以 一 定 显著 水 平 优 于 另 一 个 算法 的 概率 会 随 着 评测 方法 的 增加 
而 增加 。 如 果 不 同 的 评测 方法 是 独立 的 ， 上 述 的 Bonferroni 校正 法 可 以 使 用 。 然 而 ， 由 于 
评测 方法 往往 是 相关 的 ，Bonferroni 校正 法 可 能 过 于 严格 ， 可 以 使 用 别 的 方法 如 控制 错误 
发 现 率 [2]。 
8.2.4.5 置信 区 间 


1 尽管 我 们 将 注意 力 集中 在 对 比 研 究 上 ， 其 中 必须 在 一 组 候选 算法 中 选择 最 合适 的 一 
个 ， 这 有 了 时 需要 评测 一 些 属性 的 价值 。 例如 ， 管 理 员 可 能 想 估 计 系 统 预 测 的 错误 ; 或 者 系 


第 8 章 推荐 系统 评估 185 


统 赚 取 的 净利 润 。 当 度量 这 些 数量 时 ， 了 解 估算 的 可 靠 性 是 很 重要 的 。 一 个 流行 的 方法 是 
计算 置信 区 间 。 - 

例如 ， 也 许 估算 系统 的 RMSE WHA 1.2, BABE 1.1~1. 35 的 概率 为 0.95。 计 
算 置信 区 间 的 最 简单 方法 是 假设 这 些 兴趣 量 成 高 斯 分 布 ， 然 后 通过 多 重 独立 的 观察 值 计算 
期 望 和 标准 方差 。 当 我 们 有 很 多 观察 值 时 ， 可 以 通过 非 参 数 方法 计算 兴趣 量 的 分 布 ， 如 直 
方 图 ， 以 及 找到 包含 具有 理想 概率 的 兴趣 量 的 上 下 界 来 去 除 该 假设 。 


8.3 推荐 系统 属性 


本 节 讨 论 一 系列 属性 ， 在 决定 选择 哪 种 方法 进行 推荐 时 这 些 属 性 需要 考虑 。 由 于 不 同 
的 应 用 程序 有 不 同 的 需要 ， 系 统 设计 者 必须 决定 对 手头 的 具体 应 用 的 哪些 重要 属性 进行 评 
测 。 一 些 属 性 可 能 会 被 折衷 ， 最 明显 的 一 个 例子 或 许 是 当 其 他 属性 (如 多 样 性 ?改善 时 ， 准 
确 率 降低 了 。 了 和 解 并 评估 这 些 折 训 和 它们 对 整体 效果 的 影响 是 重要 的 。 然 而 ， 如 何在 无 须 
大 量 在 线 测试 和 领域 专家 知识 的 情况 下 以 恰当 的 方式 获得 这 样 的 认识 还 是 一 个 未 解决 的 
问题 。 

另外 ， 其 中 许多 属性 对 用 户 体 验 的 影响 是 未 知 的 ， 而 且 是 取决 于 应 用 程序 。 虽 然 我 们 
确实 可 以 推测 出 用 户 会 喜欢 不 同 的 推荐 或 者 被 告知 置信 区 间 界 限 ， 但 证 明 这 在 实际 中 确实 
很 重要 是 必要 的 。 因 此 ， 当 你 提出 改善 其 中 一 个 熟悉 的 方法 时 ， 也 应 该 评估 一 下 该 属性 的 
改变 如 何 影响 用 户 体 验 ， 可 以 通过 用 户 调查 或 者 在 线 实验 。 

该 实验 一 般 会 使 用 单一 的 推荐 方法 ， 该 方法 有 一 个 可 调整 参数 来 影响 被 考虑 在 内 的 属 
性 。 例 如 ， 我 们 可 以 设想 一 个 参数 控制 推荐 列表 的 多 样 性 。 然 后 ， 物 品 应 该 以 基于 该 参数 
不 同 值 的 推荐 进行 显示 ， 我 们 应 该 评测 参数 对 用 户 体验 的 影响 。 我 们 不 应 该 评测 用 户 是 否 
注意 到 了 属性 的 变化 ， 而 应 该 评测 属性 的 变化 是 否 影响 了 用 户 与 系统 的 交互 。 正 如 在 用 户 
调查 情况 下 一 样 ， 最 好 不 让 用 户 调查 的 受 试 对 象 和 在 线 实验 的 用 户 知道 实验 目的 。 很 难 设 
想 这 个 过 程 在 离线 实验 下 进行 ， 因 为 我 们 需要 知道 用 户 对 参数 的 反应 。 

一 旦 某 个 特定 的 系统 属性 对 手头 应 用 程序 的 用 户 的 影响 被 充分 理解 ， 那 么 我 们 就 可 以 
用 这 些 属性 的 差异 来 选择 推荐 。 


8.3.1 用 户 偏好 


在 本 章 中 我 们 感 兴趣 的 是 选择 问题 ， 我 们 需要 从 一 组 候选 算法 中 选择 一 个 算法 ， 一 个 
显而易见 的 选择 就 是 进行 用 户 调查 (对 象 内 ) ， 请 求 参 与 者 选择 其 中 一 个 系统 [25]。 这 个 评 
估 并 不 把 受 试 对 象限 制 在 特定 的 属性 上 ， 通 常用 户 做 出 这 种 判断 要 比 给 体验 打分 更 容易 。 
然后 ， 我 们 可 以 选择 得 票数 最 多 的 系统 。 

然而 ， 除 了 之 前 讨论 的 用 户 调查 的 偏差 ， 我 们 还 应 该 知道 有 一 些 其 他 的 问题 。 首 先 ， 
上 述 方案 假设 所 有 用 户 是 平等 的 ， 这 可 能 并 不 总 是 正确 的 。 比 如 ， 一 个 电子 商务 网 站 可 能 
更 喜欢 购买 了 很 多 物品 的 用 户 的 观点 而 不 是 只 买 了 一 个 物品 的 用 户 的 观点 。 因 此 如 果 可 
行 ， 我 们 需要 进一步 根据 用 户 的 重要 性 为 投票 加 权重 。 在 用 户 调查 中 分 配 正 确 的 重要 性 权 
重 可 能 并 不 容易 。 

也 有 可 能 出 现 这 种 情况 ， 喜 欢 A 系统 的 用 户 只 是 稍微 喜欢 ， 而 喜欢 系统 B 的 用 户 可 
能 对 A 的 评价 很 低 。 在 这 种 情况 下 ， 即 使 有 很 多 的 用 户 选择 系统 A， 实 际 可 能 还 是 想 选择 
系统 B。 为 了 评测 该 情况 ， 在 做 用 户 调查 时 ， 对 偏好 问题 我 们 需要 无 二 义 性 的 答案 。 于 
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是 ， 用 户 之 间 的 校准 分 数 问 题 出 现 了 。 

最 后 ， 当 我 们 想 改善 一 个 系统 时 ， 了 解 人 们 喜欢 这 个 系统 超过 另 一 个 系统 的 原因 是 很 
重要 的 。 通 常 ， 在 比较 特定 的 属性 时 ， 比 较 容易 理解 。 因 此 ， 用 户 满意 度 的 预测 是 重要 
的 ， 而 将 满意 度 分 为 较 小 组 件 有 助 于 理解 并 改善 系统 。 


8.3.2 预测 准确 度 


预测 准确 度 是 目前 在 推荐 系统 研究 中 讨论 最 多 的 属性 。 在 大 多 数 推荐 系统 底层 有 一 个 预 
测 引 敬 。 这 个 引擎 可 能 预测 用 户 对 物品 的 看 法 (如 对 电影 的 打分 ?或 者 使 用 概率 (如 购买 )。 

推荐 系统 中 有 一 个 基本 的 假设 ， 即 用 户 更 喜欢 推荐 更 精确 的 系统 。 因 此 许多 研究 人 员 
着 手 于 寻找 提供 更 精确 预测 的 算法 。 

预测 准确 度 通 常 独 立 于 用 户 界 面 ， 可 以 通过 离线 实验 评测 。 在 用 户 调查 中 评测 预测 准 
确 度 是 评测 给 定 推 荐 的 准确 度 。 这 与 没有 推荐 的 用 户 行为 预测 是 不 同 的 概念 ， 它 更 接近 真 
实 系 统 中 的 真实 准确 庶 。 

我 们 在 这 讨论 三 大 类 预测 准确 度 评 测 : 评分 预测 准确 座 评 测 ， 使 用 预测 准确 座 评 测 ， 
物品 排名 预测 准 价 度 评测 。 
8.3.2.1 评分 预测 准确 度 评 测 


在 一 些 应 用 中 ， 如 在 流行 的 Netflix DVD 租赁 服务 的 最 新 发 布 页 面 ， 我 们 希望 预测 用 
户 对 某 个 物品 的 评分 (如 1 到 5 星 )。 在 这 种 情况 下 我 们 希望 评测 系统 评分 预测 的 准确 度 。 
均 方 根 误 姜 (RMSE) 大 概 是 在 评估 评分 预测 中 最 流行 的 度量 。 系 统 在 已 知 用 户 一 物品 
集合 Cu， 店 的 真实 评分 情况 下 在 测试 集 T 上 生成 预测 评分 高 。 通 常 6 为 已 知 是 因为 它们 
隐藏 在 离线 实验 中 或 者 是 通过 用 户 调查 或 在 线 实验 获得 的 。 预 测评 分 与 实际 评分 间 的 


RMSE 由 下 式 给 出 ， 
j. ^ i 
RMSE = ( "ui "ui j* . 
T DET E i " i 
3.15 £8 S 3€ CMAEO to Je — 4 6 HL GG PR. a PONAM s 


1 C 1A 
MAE = TFT. Dlr (8. 3) 

相 比 于 MAE, RMSE AN pbb (A f P] C ROE. EE, e Hat: A A RON d 8 w 
试 集 的 情况 下 ，RMSE 适用 在 前 三 个 评分 误差 为 2、 第 四 个 评分 误差 为 0 的 系统 ， 而 
MAE 适用 于 一 个 评分 误差 为 3、 其 他 三 个 误差 为 0 的 系统 。 

Ji — 125975 HLUR 3€ NM RSEO 和 归 一 化 平均 绝对 误 亲 CNMAE) 是 在 一 定 评分 范围 内 
《如 ) 归 一 化 了 的 RMSE 和 MAE。 由 于 它们 只 是 RMSE 和 MAE 的 缩减 版 本 ， 算 法 排序 结 
果 与 未 归 一 化 时 相同 。 

. 平均 RMSE 和 平均 MAE 调整 非 均 衡 的 测试 集 。 例 如 ， 如 果 测 试 集 的 物品 分 布 不 均衡 ， 
在 此 测试 集 上 计算 出 的 RMSE 或 MAE 可 能 会 受到 高 频 物 品 产生 的 误差 的 严重 影响 。 如 果 
我 们 需要 一 个 方法 来 代表 任意 物品 的 预测 误 益 ， 那 么 最 好 分 别 计算 每 个 物品 的 MAE 或 
RMSE， 然 后 再 了 到 所 有 物品 的 平均 值 。 类 似 地 ， 如 果 测 试 集 的 用 户 分 布 不 均衡 ， 又 希望 扒 
断 出 一 个 随机 抽取 的 用 户 所 要 面临 的 预测 误差 ， 那 么 我 们 可 以 计算 每 个 用 户 的 平均 RMSE 
fll MAE, 

RMSE 和 MAE 仅 取决 于 误差 的 帆 度 大 小 。 而 在 某 些 应 用 中 ， 评 分 的 语义 可 能 使 得 预 
测 误 差 不 仅 取决 于 其 幅度 大 小 。 在 这 样 的 城中 可 能 需要 一 个 合适 的 失真 测量 CP, ro EAR 
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是 平方 差 或 者 绝对 差 。 例 如 ， 一 个 应 用 有 一 个 3 BAS, 1 表示 “不 喜欢 ”，2 表示 “中 立 ”， 
3 表示 “喜欢 ”， 而 且 推 荐 给 用 户 不 喜欢 的 物品 比 不 给 用 户 推 荐 物品 更 糟糕 ， 这 时 一 个 设置 
A dG, 1)=5, d(2, 1)=3, d(3, 22723, dl, 2)=1, d(2, 3)=1 Md, 3)=2 的 
失真 测量 可 能 是 合理 的 。 
8.3.2.2 使 用 预测 准确 度 评 测 

在 许多 应 用 中 ， 推 荐 系统 并 不 预测 用 户 对 物品 的 偏好 ， 如 电影 评分 ， 而 是 向 用 户 推荐 
他 们 可 能 会 用 到 的 物品 。 例 如 ， 当 电影 被 添加 到 队列 时 ，Netflix 会 根据 加 入 的 电影 推荐 
一 组 用 户 可 能 感 兴趣 的 电影 。 在 这 种 情况 下 ， 我 们 感 兴趣 的 不 是 系统 是 否 正确 地 预测 这 些 
电影 的 评分 ， 而 是 系统 是 否 正 确 地 预测 用 户 是 否 会 将 电影 放 和 人 队列 (使 用 物品 )。 

在 对 使 用 预测 进行 离线 评估 时 ， 我 们 通常 有 一 组 由 每 个 用 户 使 用 过 的 物品 组 成 的 数据 
集 。 然 后 选择 一 个 测试 用 户 ， 隐 藏 他 的 一 些 选择 ， 并 要 求 推荐 预测 一 组 用 户 会 用 到 的 物品 
集 。 对 于 推荐 和 隐藏 的 物品 ， 有 4 种 可 能 的 结果 ， 如 表 8. 1 所 示 。 


表 8. 1 为 用 户 推荐 项 目 可 能 结果 的 分 类 


被 推荐 未 被 推荐 
使 用 真 阳性 数 (tp) 假 阴性 数 (fn) 
未 被 使 用 假 阳性 数 (fp) 真 阴性 数 (tn) 


在 离线 情况 下 ， 由 于 数据 并 不 是 由 经 过 评估 的 推荐 系统 收集 的 ， 我 们 被 迫 假设 没有 被 
使 用 的 物品 即使 被 推荐 了 也 不 会 被 使 用 。 例 如 ， 用 户 不 感 兴趣 或 者 对 用 户 无 用 。 这 个 假设 
有 可 能 不 成 立 ， 比 如 ， 当 未 被 使 用 的 物品 包含 一 些 用 户 没有 选择 但 是 感 兴趣 的 物品 时 。 例 
如 ， 用 户 没 有 使 用 某 个 物品 是 因为 不 知道 它 的 存在 ， 当 推荐 展示 了 该 物品 时 ， 用 户 就 可 以 
决定 选择 它 了 。 在 这 种 情况 下 ， 假 阳性 数 的 数量 被 高 估 了 。 

我 们 可 以 计算 落 入 表 中 每 个 单元 格 的 例子 的 数量 ， 并 计算 如 下 数值 


Precision = (8.4) 


Recall(True Positive Rate) — (8. 5) 


# tp 
#tp+ # fn 


False Positive Rate(1 — Specificity) = (8. 6) 


__#fp — 
#fp+ #tn 

通常 我 们 已 知 这 些 数值 之 间 可 以 互相 影响 抵消 。 如 果 人 允许 更 长 的 推荐 列表 通常 会 提高 
AA, 但 也 可 能 会 减少 查 准 率 。 如 果 应 用 中 展示 的 推荐 数量 是 预定 的 ， 计 算 兴 趣 最 有 用 
的 方法 是 计算 Top-N 查 准 率 。 

在 为 用 户 展示 的 推荐 数量 未 预定 的 应 用 中 ， 评 估算 法 时 最 好 在 一 定 推荐 列表 长 度 范围 
内 ， 而 不 是 使 用 固定 的 长 度 。 因 此 ， 我 们 可 以 计算 查 准 率 和 查 全 率 的 比较 曲线 或 者 真 阴 性 
数 和 假 阴 性 数 的 比例 曲线 。 前 者 被 简化 成 为 查 准 率 一 查 全 率 曲线 ， 后 者 被 简化 成 为 观测 者 
操作 特征 8 (Receiver Operating Characteristic) z; ROC HHA. 虽然 两 种 曲线 都 是 为 了 计算 
用 户 偏 好 物品 占 真正 推荐 的 物品 的 百分比 ， 但 查 准 率 一 查 全 率 曲 线 着 重 于 用 户 偏好 的 物品 
的 比例 ， 而 ROC 则 着 重 于 最 终 被 推荐 但 用 户 不 喜欢 的 推荐 比例 。 

我 们 应 该 根据 领域 的 属性 和 应 用 的 目标 来 决定 使 用 查 准 率 一 查 全 率 曲 线 还 是 ROC 曲 


O 其 出 处 涉及 信号 检测 理论 。 
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线 。 例 如 ， 假 设 有 一 个 在 线 视频 租赁 服务 为 用 户 推荐 DVD。 它 的 查 准 率 评测 是 指 真正 适 
合用 户 的 推荐 比例 。 无 论 不 合适 推荐 所 展示 的 是 一 小 部 分 还 是 大 部 分 ， 曾 被 推荐 过 的 不 合 
适 DVD 都 与 系统 为 用 户 推荐 的 相关 物品 所 占 比 例 无 关 ， 因 此 查 准 率 一 查 全 率 曲线 适用 该 
应 用 。 另 一 方面 ， 考 虑 一 个 选择 物品 向 用 户 销 售 的 推荐 系统 ， 比 如 ， 将 物品 通过 邮件 发 送 
给 用 户 ， 如 果 用 户 不 购买 则 不 需要 成 本 。 在 这 种 对 实现 尽 可 能 多 的 潜在 销售 的 同时 最 小 化 
市 场 成 本 感 兴趣 情况 下 ，ROC 曲线 要 比 查 准 率 一 查 全 率 曲 线 更 具有 相关 性 。 

给 定 两 个 算法 ， 我 们 为 每 个 算法 计算 出 一 对 这 样 的 曲线 ， 如 果 一 种 曲线 完全 优 于 另外 
一 种 曲线 ， 那 么 决定 优越 的 算法 变 得 容易 。 然 而 ， 当 曲线 相交 时 ， 决 定 就 不 那么 明显 ， 取 
决 于 讨论 中 的 应 用 。 应 用 的 相关 知识 将 告诉 我 们 决定 应 基于 曲线 的 哪个 区 域 。 

归纳 ROC 和 查 准 率 - 查 全 率 的 方法 ， 如 F 测量 [58] 及 ROC 曲线 下 方面 积 (AUC)[1]， 对 
应 用 中 算法 的 独立 比较 是 有 用 的 ， 但 当 为 一 个 特定 的 任务 选择 算法 时 ， 更 好 的 方法 是 通过 
能 够 反映 现 有 特定 需求 的 方法 进行 选择 。 

多 个 用 户 的 查 准 率 - 查 全 率 和 ROC 曲线 

当 评估 多 个 用 户 的 查 准 率 - 查 全 率 和 ROC 曲线 时 ， 根 据 不 同 的 应 用 有 很 多 策略 可 以 用 
来 加 强 结果 。 

在 为 每 个 用 户 都 制定 固定 数量 推荐 结果 的 应 用 中 (例如 ， 当 用 户 访问 一 个 新 闻 门 户 
时 显示 固定 数量 的 新 闻 头 条 )， 我 们 可 以 为 每 个 用 户 计算 推荐 列表 长 度 为 N 时 的 查 准 率 
和 查 全 率 ( 或 真 阴性 率 和 假 阴 性 率 ) ， 然 后 在 每 个 N 上 计算 正确 度 和 查 全 率 ( 或 真 阴性 率 
和 假 阴性 率 ) 的 平均 值 L51]。 由 此 得 到 的 曲线 是 十 分 有 价值 的 ， 因 为 它们 为 每 个 可 达到 
的 查 准 率 和 查 全 率 规定 了 一 个 N 值 (或 真 阴性 率 和 假 阴性 率 )， 反 过 来 ， 该 曲线 还 可 以 
用 来 评估 在 某 一 给 定 N 值 上 的 性 能 。 以 这 种 方式 得 到 的 曲线 叫 作 Customer ROC 曲线 
(CROC)[52]. 

当 可 以 向 每 个 用 户 展示 不 同 数目 的 推荐 时 (如 向 每 个 用 户 展示 所 有 被 推荐 电影 的 集 
合 )， 我 们 可 以 通过 以 下 过 程 计 算 ROC 或 者 查 准 率 - 查 全 率 曲 线 ， 将 测试 集中 的 隐藏 评分 
合 到 用 户 -物品 对 的 参考 集中 ， 使 用 推荐 系统 生成 单一 的 用 户 - 物 品 对 的 排名 列表 ， 从 列表 
中 选择 最 前 面 的 推荐 ， 在 参考 集 上 为 推荐 评分 。 以 这 种 方法 计算 得 到 的 ROC 曲线 叫 作 
Global ROC 曲线 (GROC)[52]。 在 结果 曲线 上 选取 一 个 工作 区 间 可 能 会 导致 不 同 数目 的 推 
BAP. 

最 后 一 类 应 用 ， 其 推荐 过 程 更 加 具有 互动 性 ， 用 户 可 以 得 到 越 来 越 多 的 推荐 。 这 是 经 
典 的 信息 检索 任务 ， 用 户 可 以 一 直 要 求 系统 给 出 更 多 的 文档 。 在 这 种 应 用 中 ， 我 们 为 每 个 
用 户 计算 查 准 率 - 查 全 率 曲 线 ( 或 ROC 曲线 )， 然 后 计算 所 有 用 户 结果 曲线 的 均值 。 这 是 信 
息 检索 社区 计算 查 准 率 - 查 全 率 曲 线 的 一 个 常用 方法 ， 特 别 是 在 具有 影响 力 的 TREC 比赛 
中 [59]j。 这 样 一 个 曲线 可 以 用 来 理解 一 个 典型 用 户 可 能 面 对 的 查 准 率 和 查 全 率 的 折衷 。 
8.3.2.3 排名 方法 


在 许多 情况 下 应 用 通常 将 给 用 户 展示 的 推荐 设 为 垂直 或 水 平 列 表 ， 利 用 某 种 天 然 的 济 
览 秩序 。 例 如 ， 在 Netflix 中 ， 标 签 你 将 会 喜欢 的 电影 ”显示 一 组 分 类 ， 以 及 每 组 分 类 中 
系统 预测 用 户 会 喜欢 的 电影 列表 。 这 些 列 表 可 能 很 长 ， 用 户 可 能 需要 继续 查看 别 的 “页 面 ” 
直到 所 有 的 列表 被 浏览 。 在 这 种 应 用 中 ， 我 们 感 兴趣 的 不 是 之 前 章节 中 所 提 到 的 预测 具体 
的 评分 或 选择 一 组 被 推荐 的 物品 等 ， 而 是 根据 用 户 偏好 为 物品 排序 。 这 个 任务 通常 称 为 物 
品 排名 。 有 两 种 方法 可 以 评测 这 种 排名 的 准确 度 。 我 们 可 以 尝试 判断 推荐 给 用 户 的 物品 集 
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的 正确 顺序 ， 评 测 系统 距离 正确 的 顺序 。 或 者 我 们 可 以 尝试 评测 系统 排名 的 效用 。 我 们 首 
先 介绍 离线 测试 上 的 方法 ， 然 后 介绍 这 些 方法 在 用 户 调查 和 在 线 测试 上 的 可 行 性 。 
使 用 偏好 排名 


为 评估 相对 于 参考 排序 的 排序 算法 (一 个 正确 的 顺序 )， 首 先 需 要 获取 这 样 一 个 参考 。 
在 用 户 对 物品 的 显 性 评分 可 获得 的 情况 下 ， 我 们 可 以 将 被 评分 的 物品 按照 评分 递减 排序 ， 
且 排 名 可 相同 。 例 如 ， 在 Netflix 中 ， 用 户 排 过 名 的 电影 可 以 以 递减 顺序 排序 ， 评 分 同 为 5 
星 的 电影 ， 紧 跟 评 分 同 为 4 星 的 电影 。 在 我 们 只 有 使 用 数据 的 情况 下 ， 需 要 构建 一 个 参考 
排名 ， 其 中 用 户 用 过 的 物品 排 在 闲置 物品 之 上 。 然 而 ， 这 只 有 在 用 户 知道 闲置 物品 的 存在 
时 有 效 ， 因 此 我 们 可 以 推断 实际 上 用 户 喜 欢 用 过 的 物品 而 不 是 未 用 过 的 。 因 此 ， 例 如 ， 在 
线 音乐 应 用 的 日 志 像 Pandora? 可 以 用 于 构建 参考 排名 ， 跟 踪 发 现 听 取 音 乐 的 用 户 排名 比 
跳 过 的 用 户 要 高 。 再 次 ， 使 用 过 的 物品 的 排名 应 该 相同 ， 闲 置物 品 的 排名 也 应 该 相同 。 

在 以 上 两 种 参考 排名 中 ， 如 果 我 们 没有 关于 用 户 的 两 个 物品 排名 有 关联 的 信息 ， 那 么 
二 者 排序 是 相同 的 。 然 而 ， 应 用 所 使 用 的 推荐 系统 ， 如 Netflix 的 “你 会 喜欢 的 电影 "严格 
地 要 求 物品 排名 不 相同 。 在 这 种 情况 下 ， 在 参考 排名 中 分 数 相同 的 物品 在 被 评估 的 系统 中 
一 个 排 在 另 一 个 之 前 时 ， 系 统 不 应 该 被 惩罚 。 归 一 化 的 基于 距离 的 性 能 评测 (NDPM) 方 法 
[61] 适 用 于 这 种 情况 。 如 果 在 用 户 u Bn, 个 物品 i 上 有 参考 排名 rs 和 系统 排名 fs， 那 么 
我 们 可 以 做 出 如 下 定义 : 


C= 2 seni, — ry)sgn(?4 — Fy) (8. 7) 
C= ec — ry sgn(Fy — Pa) (8. 8) 
oe Denko = on W 
C = Sut. =f) (8. 10) 
Qn = QC 一 (cr+c-) (8. 11) 


Job, AMMEN MR n (wm — D... C 为 参考 排名 所 显示 的 排序 中 (例如 ， 


排名 可 相同 ) 物 品 对 数量 ， 而 C+ 和 C- -分别 为 系统 排名 所 显示 的 正确 排序 和 错误 排序 的 物 
品 对 数量 。C"% 为 在 参考 排名 中 无 相同 排名 而 系统 排名 中 有 相同 排名 的 情况 下 的 物品 对 数 
量 。 于 是 ，NDPM 可 以 由 下 式 给 出 : 


NDPM = (8. 12) 


C 二 0.5C” 
SENE. E 
因此 ， 当 系统 正确 的 预测 参考 中 显示 每 个 偏好 的 关系 时 ，NDPM 方法 会 给 出 一 个 完美 的 0 
分 。 最 差 的 分 数 1 赋 给 那些 预测 与 每 个 参考 偏好 关系 相 矛 盾 的 系统 。 只 有 在 与 参考 偏好 关 
系 相 反 数 超过 一 半 时 预测 才 被 惩罚 。 预 测 的 偏好 参考 未 提供 时 (例如 ， 我 们 不 知道 用 户 真 
实 的 偏好 ) 不 受 惩罚 。 

在 某 些 情况 下 ， 我 们 可 能 完全 了 解 用 户 对 某 些 物 品 集 的 真实 嘉 好。 例如， 我 们 可 以 通 
过 为 用 户 提供 二 项 选择 来 推导 用 户 的 真实 顺序 。 在 这 种 情况 下 ， 一 个 物品 对 在 参考 排名 中 
排序 相同 意味 着 用 户 其 实 对 两 个 物品 不 关心 。 因 此 ， 一 个 理想 的 系统 不 应 将 一 个 物品 排 在 
另 一 个 物品 之 前 。 排 名 相关 性 方法 如 Spearman 的 p 或 Kendall 的 r [30，31] 可 以 用 在 这 
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种 情况 下 。 这 些 方法 在 实际 使 用 中 有 更 高 的 相关 性 [18]。Kendall H r h FARAH: 
TN imi 6g (8.13) 
t= = 





而 Spearman 的 o 由 下 式 给 出 : 
i D riu — PF) Fi — P) 
p CUBE (8. 14) 
其 中 ，。 和 c(。) 表 示 均 差 和 标准 差 。 注 意 ， 在 排名 相同 时 ， 每 个 物品 被 赋值 为 平均 排名 ， 
例如 ， 如 果 排 在 第 二 、 第 三 位 置 的 两 个 物品 排名 相同 ， 那 么 他 们 的 排名 被 赋 为 2. 5 [31]. 
基于 可 用 性 的 排名 
在 与 某 些 “真实 ?排名 相关 性 上 使 用 参考 排名 对 排名 进行 评分 的 同时 ， 有 其 他 的 标准 来 
决定 物品 列表 的 顺序 。 其 中 一 个 流行 的 方法 是 假设 推荐 列表 的 效用 是 累积 的 ， 由 个 人 的 推 
荐 效用 之 和 给 出 。 每 个 推荐 的 效用 为 该 被 推荐 物品 的 效用 基于 其 在 推荐 列表 中 的 位 置 打 一 
个 折扣 。 一 个 关于 此 效用 的 例子 是 用 户 注意 列表 中 位 置 为 i 的 推荐 的 可 能 性 。 通 常 假设 用 
户 是 从 头 到 尾 的 浏览 推荐 ， 而 越 往 后 推荐 的 效用 的 折扣 越 大 。 该 折扣 也 可 以 定义 为 用 户 注 
意 到 列表 中 某 个 特定 位 置 的 推荐 的 概率 ， 鉴 于 推荐 的 效用 仅 取 决 于 物品 推荐 。 在 该 定义 
中 ， 推 荐 列表 中 的 特定 位 置 被 注意 到 的 概率 假定 只 与 位 置 相关 而 与 被 推荐 的 物品 无 关 。 
在 许多 应 用 中 ， 用 户 只 能 使 用 单个 物品 或 者 一 个 很 小 的 物品 集 ， 或 者 推荐 引 敬 没有 被 
用 作 主 要 浏览 工具 。 在 这 样 的 情况 下 ， 我 们 只 能 期 望 用 户 只 会 注意 到 推荐 列表 顶部 的 少数 
物品 。 我 们 可 以 使 用 一 种 随 着 列表 上 位 置 的 下 降 衰 减 非 常 迅速 的 方法 来 模拟 这 样 的 应 用 。 
R-Score 度量 [8 假设 对 于 每 个 用 户 推荐 值 沿 着 排名 列表 以 指数 形式 递减 
max(rs —d,0) 


R, =p» oo: CENE (8. 15) 


其 中 , i 是 位 置 为 7 的 物品 ，r 是 用 户 ai 的 评分 ， d 是 任务 相关 的 中 立 (“ 不 在 

乎 ”评分 ，x 是 半衰期 参数 ， 控 制 着 排名 列表 中 位 置 值 的 指数 衰减 。 在 评分 预测 任务 中 ， 

ru 是 用 户 对 每 个 物品 的 评分 (如 4 星 )，d 是 不 关心 的 投票 (如 3 星 )， 算 法 只 获取 分 数 高 于 

“不 在 乎 "和 4d( 如 4 星 或 5 星 ) 的 排名 物品 的 分 数 。 在 使 用 预测 任务 中 ， 如 果 用 户 选 择 物 品 

i，ru 则 为 1， 否则 为 0，d 为 0。 如 果 物 品 i REA, WW r= —log(popularityC)) , AM 

为 0， 这 样 可 以 从 推荐 中 获取 一 定 的 信息 量 。 由 此 生成 的 每 个 用 户 的 得 分 由 下 式 合计 : 
DR. 


YR : (8. 16) 


R — 100 





HH, RI BAP u 最 可 能 排名 的 分 数 。 

在 其 他 应 用 中 用 户 可 能 要 阅读 相当 大 一 部 分 的 列表 。 在 某 些 类 型 的 搜索 中 ， 例 如 ， 查 
找 法 律 文件 [24]， 用 户 可 能 会 搜索 所 有 相关 的 物品 ， 愿 意 阅 读 推荐 列表 的 大 部 分 。 在 这 种 
情况 下 , 位 置 折扣 需要 一 个 较 低 的 衰减 。 归 一 化 折扣 累计 收益 (Normalized Discounted 
Cumulative Gain，NDCG)[27] 是 一 个 来 自 于 信息 检索 的 方法 ， 其 中 位 置 以 对 数 形式 衰减 。 
假设 用 户 被 推荐 物品 i 会 得 到 一 个 “收益 ”gs ， 物 品 集合 J 的 平均 折扣 累计 收益 (Dis- 
counted Cumulative Gain, DCG) 可 um 


pig LS) 5) E 


u=] i. uL ETS (8. 17) 
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其 中 对 数 的 底 是 自由 参数 ， 通 常 在 2 一 10。 对 数 底 为 2 一 般 用 来 保证 所 有 位 置 都 已 衰减 。 
NDCG 是 DCG 的 归 一 化 版 本 ， 如 下 式 所 示 : 
NDCG = .DCG 





其 中 是 DCG "为 理想 的 DCG. 

我 们 展示 这 两 种 方法 正如 它们 最 初 被 展示 的 一 样 ， 但 注意 两 种 情况 下 的 分 子 包 含 一 个 
效用 函数 ， 该 函数 为 每 个 物品 进行 赋值 。 我 们 可 以 使 用 一 个 对 于 设计 的 应 用 更 合适 的 函数 
来 代替 原来 的 效用 函数 。 一 个 与 R-score 和 NDCG 密切 相关 的 方法 是 平均 逆 命 中 率 (Aver- 
age Reciprocal Hit Rank，ARHR)[14],， 一 个 没有 被 归 一 化 方法 ， 为 在 位 置 的 成 功 推荐 
的 效用 赋值 为 1/&k。 因 此 ，ARHR 衰减 的 比 R-score 慢 但 比 NDCG 快 。 

在 线 排名 评估 

在 为 评估 推荐 列表 排名 而 设计 的 在 线 实验 中 ， 我 们 可 以 观察 用 户 与 系统 的 交互 。 在 推 
荐 列表 展现 在 用 户 面前 时 ， 用 户 可 能 会 从 列表 中 选择 一 定量 的 物品 。 那 么 我 们 就 可 以 假设 
用 户 至 少 浏览 到 了 最 后 选择 的 位 置 。 也 就 是 ， 如 果 用 户 选 择 了 物品 1、3、10， 我 们 就 可 以 
推断 用 户 查 看 了 1 一 10 个 物品 。 此 时 ， 我 们 可 以 做 出 另外 一 个 假设 ， 用 户 对 1、3、10 比 
较 感 兴趣 ， 而 对 物品 2、4、5、6、7、8、9 不 感 兴趣 。 在 某 些 情况 下 我 们 可 以 得 到 额外 的 
信息 ， 用 户 是 否 注意 到 更 多 的 物品 。 例 如 ， 如 果 列 表 分 散在 几 个 页 面 ， 每 页 只 显示 20 个 
结果 ， 那 么 在 上 述 的 例子 中 ， 如 果 用 户 移 到 第 二 页 ， 那 么 我 们 还 可 以 假设 用 户 浏览 了 结果 
11 一 20， 并 发 现 它们 都 是 无 关 的 。 

在 上 面 的 情况 中 的 交互 结果 分 为 三 部 分 一 一 感 兴趣 的 物品 (上 面 例 子 中 的 1、3、10)， 
不 感 兴趣 的 物品 (从 1— 20 的 其 他 物品 )， 还 有 一 些 未 知 物品 (21 到 列表 结尾 ) 。 现 在 我 们 可 
以 使 用 一 个 合适 的 参考 排名 指标 来 为 原来 的 列表 打分 。 有 两 种 不 同 的 方法 可 以 做 到 。 首 
先 ， 参 考 列表 可 以 包括 顶部 的 感 兴 趣 的 物品 ， 然 后 是 未 知 物品 和 底部 的 不 感 兴趣 的 物品 。 
参考 列表 体现 了 用 户 可 能 只 选择 一 小 部 分 的 感 兴趣 物品 ， 因 此 未 知 物品 可 能 包含 更 多 的 感 
兴趣 的 物品 。 其 次 ， 参 考 列表 可 以 将 感 兴 趣 物 品 置 于 顶部 ， 紧 接着 是 不 感 兴趣 物品 ， 而 直 
接 完 全 忽略 未 知 物品 。 这 在 不 合理 偏好 假设 可 能 会 产生 消极 效果 时 是 有 用 的 ， 比 如 ， 未 知 
物品 在 排列 中 优 于 不 感 兴趣 物品 。 不 管 在 哪 种 情况 ， 应 该 牢记 参考 排名 因 离 线 评估 的 情况 
而 不 同 。 在 离线 评估 中 ， 我 们 有 一 个 被 假设 为 是 正确 的 参考 排名 ， 然 后 衡量 每 个 推荐 偏离 
“正确 ?排名 有 多 少 。 在 线 情况 下 ， 参 考 排 名 是 显示 的 推荐 排名 中 用 户 可 能 会 喜欢 的 排名 。 
离线 情况 下 ， 我 们 假设 有 一 个 正确 的 排名 ， 而 在 线 情况 下 我 们 允许 有 多 个 正确 的 排名 。 

对 于 效用 的 排名 ， 我 们 可 以 基于 所 选 物品 的 效用 之 和 对 列表 进行 评估 。 因 此 ， 将 效用 
高 的 感 兴趣 物品 排名 放 在 靠近 列表 开头 的 列表 优 于 将 感 兴趣 物品 放 在 列表 末尾 处 的 列表 ， 
因为 对 于 后 者 ， 用 户 一 般 根 本 不 会 注意 那些 感 兴趣 物品 ， 对 推荐 无 用 。 


8.3.3 BR 


正如 推荐 系统 的 预测 精度 ， 在 许多 情况 下 特别 是 在 协同 过 滤 系 统 ， 随 着 数据 量 的 增加 
而 增加 ， 一 些 算 法 可 能 提供 高 质量 的 推荐 ， 但 只 对 一 小 部 分 具有 大 量 数 据 的 物品 而 言 。 物 
品 覆 盖 率 可 以 参考 我 们 下 面 要 讨论 的 几 个 不 同 的 系统 属性 。 
8.3.3.1 物品 空间 覆盖 率 

最 常见 的 物品 覆盖 率 的 定义 为 系统 可 以 推荐 的 物品 的 比例 。 也 经 常 称 为 目录 覆盖 率 。 
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最 简单 的 目录 覆盖 率 的 计算 方法 是 计算 所 有 曾经 被 推荐 过 的 物品 的 百分比 。 在 许多 情况 下 
该 方法 可 以 根据 算法 和 输入 的 数据 集 进行 直接 计算 。 

一 个 更 有 用 的 方法 是 计算 离线 、 在 线 或 用 户 调查 实验 中 被 推荐 给 用 户 的 物品 所 占 的 比 
” 例 。 有 时 可 能 要 为 物品 加 权重 ， 如 流行 度 或 效用 。 因 此 ， 我 们 同意 ,无 论 如 何 也 不 会 推荐 
很 少 被 使 用 的 物品 ， 但 忽略 关注 度 很 高 的 物品 ， 这 是 无 法 容忍 的 。 

另 一 个 计算 目录 覆盖 率 的 方法 是 销售 多 样 性 [16]， 衡 量 在 使 用 特定 推荐 系统 时 用 户 是 如 
何 选择 不 同 的 物品 的 。 如 果 对 于 每 个 物品 i 用户 的 选择 概率 记 为 p(i)， 基 尼 系 数 由 下 式 给 出 : 


1 = : . 
pus , |1 
G 1240 n— 1 pG;) (8, 19) 


其 中 , i, ee i, 为 物品 列表 ， 按 照 概率 p( 让 递增 排序 。 当 所 有 物品 被 选择 的 频率 一 样 时 
该 系数 为 0， 如 果 只 有 一 个 物品 被 选择 则 该 系数 为 1。 每 个 物品 被 推荐 次 数 的 基尼 系数 也 
能 用 上 。 另 外 一 个 计算 不 均等 分 布 的 方法 是 香农 炉 : 


n 


H —— 5) p(i)logp(i) (8. 20) 


"OEA-IL GR LA ONERE, MAO M n MTS IRBE, DS logn 
8.3.8.2 用 户 空间 覆盖 率 


覆盖 率 也 可 以 是 用 户 或 用 户 与 可 以 推荐 物品 的 系统 的 交互 所 占 比例 。 在 许多 应 用 中 推 
荐 系统 可 能 不 会 为 某 些 用 户 进 行 推荐 ， 比 如 ， 该 用 户 的 预测 准确 度 置信 度 低 。 这 种 情况 下 
我 们 比较 喜欢 可 以 为 更 广泛 用 户 提 供 推荐 的 系统 。 很 明显 这 样 的 推荐 系统 应 该 在 覆盖 率 和 
准确 率 的 折衷 上 进行 评估 。 

覆盖 率 可 以 通过 为 获得 丰富 的 用 户 画 像 而 进行 的 推荐 来 计算 。 例 如 ， 在 协同 过 滤 实 例 中 ， 
可 以 计算 在 得 到 推荐 之 前 用 户 必须 评分 的 物品 的 数量 。 这 种 方法 通常 只 能 在 离线 实验 中 评估 。 
8.3.3.3 RAM 


另 一 个 相关 的 问题 是 众所周知 的 冷 启动 问题 一 一 系统 在 遇 到 新 物品 和 新 用 户 时 的 性 能 。 
冷 启动 问题 可 被 看 作 覆 盖 率 的 子 问题 ， 因 为 它 评估 的 是 系统 在 特定 物品 集 和 用 户 集 的 覆盖 
率 。 除 了 计算 冷 启 动物 品 和 用 户 池 ， 为 这 些 物 品 和 用 户 计算 系统 的 准确 度 也 是 很 重要 的 。 

针对 物品 冷 启 动 ， 我 们 可 以 使 用 一 个 阔 值 来 推断 冷 启动 物品 集 。 例 如 ， 可 以 推断 冷 启 
动物 品 是 那些 没有 评分 或 没有 使 用 证 据 的 物品 [52]， 或 者 是 在 系统 中 存在 不 超过 某 个 时 间 
的 物品 (如 1 天 )， 又 或 者 是 证 据 数量 不 超过 预定 值 的 物品 (例如 ， 评 分 不 超过 10) 。 或 许 更 
普遍 的 方法 是 通过 物品 在 系统 中 存在 的 时 间或 为 物品 收集 的 数据 量 来 判断 物品 是 否 “ 冷 ”。 
这 样 ， 我 们 可 以 相信 系统 会 更 多 地 预测 合适 的 冷门 物品 ， 而 少 预 测 热门 物品 。 

一 个 系统 要 更 好 地 推荐 冷门 物品 可 能 要 付出 降低 热门 物品 准确 度 的 代价 。 这 也 可 能 是 
其 他 的 原因 ， 例 如 ， 后 面 要 讨论 的 新 颖 度 和 惊喜 度 。 然 而 ， 在 计算 冷 物 品 的 系统 准确 度 时 
最 好 评估 一 下 与 整个 系统 的 准确 度 是 否 可 以 权衡 。 


8.34 BRE 


推荐 的 置信 度 可 以 定义 为 系统 在 推荐 和 预测 上 的 可 信和 度 [128，22]。 正 如 我 们 之 前 所 
述 ， 协 同 过 滤 推荐 的 准确 度 随 着 数据 量 的 增加 而 增加 。 同 样 地 ， 被 预测 属性 的 置信 度 二 般 
也 随 着 数据 量 的 增加 而 增加 。 

在 许多 情况 下 ， 用 户 受 益 于 观察 这 些 置 信和 度 分 数 [22]。 当 系统 为 推荐 物品 赋予 二 个 低 


第 8 章 推荐 系统 评估 —193 


的 置信 和 度 时 ， 用 户 可 能 会 在 下 决定 之 前 查看 更 多 的 物品 。 例 如 ， 如 果 系 统 推荐 一 个 置信 度 
高 的 电影 以 及 一 个 有 着 相同 评分 但 置信 度 低 的 电影 ， 那 么 用 户 可 能 会 立即 将 第 一 个 电影 加 
人 播放 列表 ， 再 进一步 阅读 第 二 个 电影 的 剧情 ， 在 决定 观看 之 前 或 许 会 再 浏览 几 个 电影 。 
最 常用 的 置信 度 度量 方法 是 计算 预测 值 为 真实 的 概率 ， 或 者 计算 落 于 真实 值 预定 义 部 
分 内 (如 95%) 的 区 间 。 例 如 ， 一 个 推荐 系统 可 能 以 0. 85 的 概率 正确 地 将 一 个 电影 评分 为 


4 星 ， 或 者 有 95% 的 真实 评分 位 于 预测 评分 为 4 星 的 一 1 到 十 万 区 间 内 。 计 算 置 信 度 最 普 


遍 的 方法 是 为 可 能 的 结果 提供 一 个 完整 的 分 布 [40]。 

给 定 两 个 在 其 他 相关 属性 上 性 能 相似 的 推荐 系统 ， 如 预测 准确 度 ， 一 般 会 选择 可 以 提 
供 有 效 置信 度 度量 的 系统 。 由 此 ， 给 定 两 个 准确 度 相 同 的 推荐 系统 ， 而 且 使 用 相同 方法 计 
算 置信 区 间 ， 我 们 会 倾向 于 选择 可 以 更 好 地 估计 置信 区 间 的 推荐 系统 。 

标准 置信 区 间 如 上 述 置 信 区 间 可 以 在 常规 的 离线 实验 中 直接 估计 出 来 ， 与 预测 准确 度 
的 估计 方法 相同 。 我 们 可 以 为 每 个 特定 的 置信 度 类 型 设计 一 个 分 数 ， 用 来 评估 置信 度 估计 
方法 与 真正 的 错误 预测 的 差距 。 当 算法 与 置信 度 度量 方法 不 能 达成 一 致 时 不 能 应 用 该 过 
程 ， 因 为 有 些 置信 度 评估 方法 比较 弱 因 此 比较 容易 估计 。 在 这 种 情况 下 ， 更 加 准确 地 估计 
一 个 较 弱 的 置信 度 度量 并 不 意味 着 更 好 的 推荐 。 

GED HERA AMB 置信 区 间 都 落 在 可 能 的 电影 评分 中 。 我 们 取 一 个 范围 为 95% 
内 的 置信 阔 值 来 训练 A 和 B。 对 于 每 个 训练 模型 ， 在 离线 数据 上 运行 A 和 B， 隐 藏 一 部 分 
用 户 评分 ， 让 每 个 算法 预测 缺失 的 评分 。 每 个 算法 产生 一 个 预测 评分 和 置信 区 间 。 我 们 计 
算 A+ 和 A- ， 分 别 表示 算法 A 的 预测 评分 落 在 置信 区 间 之 内 和 区 间 之 外 的 次 数 ， 对 B 做 
同样 的 计算 。 然 后 我 们 使 用 二- 和: 一 0. 97 fig tg c0 94 计算 每 个 算法 真正 的 置信 
度 。 结 果 表 明 算法 A 过 于 保守 ， 计 算出 的 区 间 太 大 ， 而 算法 B 则 比较 自由 ， 计 算出 的 区 
间 太 小 。 由 于 我 们 并 不 需要 保守 的 区 间 ， 所 以 选择 B 因为 它 预 测 的 区 间 更 接近 于 所 要 求 的 
95% 置 信和 度 。 4 

38: fei EX [8] H4 53 — ^ 17 FH 38 3E RU 6 B BEC I E Boe E UE HEREDI m. CXR 
况 下 ， 我 们 假设 推荐 系统 并 不 为 所 有 的 值 预测 分 数 ， 因 为 通常 情况 下 只 显示 前 ”个 推荐 。 因 
此 ， 我 们 可 根据 这 个 过 滤 过 程 设计 一 个 实验 ， 在 两 个 算法 过 滤 掉 低 置信 度 物 品 后 比较 二 者 的 
准确 度 。 在 该 实验 中 ， 可 以 计算 一 个 曲线 用 来 估量 过 滤 后 物品 的 每 个 部 分 的 预测 准确 度 ， 或 
者 不 同 过 滤 阔 值 的 预测 准确 度 。 该 评估 过 程 并 不 要 求 两 个 算法 都 与 置信 度 方法 一 致 。 

虽然 用 户 调查 和 在 线 实验 可 以 研究 为 用 户 体验 加 入 置信 和 度 的 效果 ， 但 要 想 知道 这 些 类 
型 的 测试 如 何 为 置信 度 估量 的 准确 度 提 供 进一步 的 证 据 是 很 难 的 。 


8.3.5 信任 度 


置信 度 是 系统 对 评分 的 信任 ， 而 这 里 所 说 的 信任 度 是 用 户 对 系统 推荐 结果 的 ? 。 例 如 ， 
推荐 用 户 已 经 知道 或 喜欢 的 物品 也 许 会 有 益 于 系统 。 这 样 ， 用 户 即 使 没有 从 推荐 中 得 到 有 
价值 的 东西 ， 但 他 注意 到 了 该 系统 提供 合理 的 推荐 ， 这 可 能 会 增加 他 对 系统 推荐 的 未 知 物 
品 的 信任 。 另 一 个 常用 的 增加 系统 信任 度 的 方法 是 解释 系统 提供 的 推荐 (可 参照 第 15 章 )。 





加 ”不 要 和 社交 网 络 研究 里 的 信任 度 弄 混淆 了 ， 用 于 衡量 用 户 有 多 信任 另 一 个 用 户 。 推 荐 系统 的 一 些 文献 中 用 
这 种 信任 衡量 方法 过 滤 用 户 ， 如 文献 [39] 和 第 20 章 。 
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系统 的 信任 度 也 可 称 为 系统 的 信用 。 

如 果 我 们 不 仅 限 于 以 上 获取 信任 的 方法 ， 有 一 个 显而易见 的 评估 用 户 信任 度 的 方法 是 
在 用 户 调查 中 询问 用 户 该 推荐 系统 是 否 合理 [22，12，11，47]。 在 线 测试 中 ， 我 们 可 以 将 
推荐 的 数量 与 推荐 在 系统 中 的 信任 度 相 结合 ， 假 设 信任 度 越 高 被 使 用 的 推荐 就 会 越 多 。 或 
者 我 们 还 可 以 假设 系统 的 信任 度 与 重复 用 户 有 关 ， 因 为 信任 系统 的 用 户 会 返回 系统 执行 别 
的 任务 。 然 而 ， 这 样 的 方法 可 能 与 用 户 满意 度 的 其 他 因素 相关 ， 因 此 可 能 不 准确 。 如 何在 
离线 实验 中 测量 信任 度 还 是 未 知 的 ， 因 为 信任 是 在 用 户 和 系统 交互 的 过 程 中 建立 的 。 


8.3.6 新 颖 度 


新 颖 的 推荐 是 指 为 用 户 推荐 他 们 以 前 没有 听 说 过 的 物品 [33]。 在 需要 新 颖 性 推荐 的 应 
用 中 ， 一 个 最 明显 简单 的 方法 是 过 滤 掉 用 户 已 经 评分 或 使 用 过 的 物品 。 然 而 ， 在 许多 情况 
下 用 户 并 不 会 提供 他 们 过 去 使 用 过 的 所 有 物品 。 因 此 ， 这 个 简单 的 方法 并 不 足够 将 用 户 已 
经 知道 的 物品 过 滤 掉 。 

我 们 可 以 在 用 户 调查 中 通过 询问 用 户 他 们 是 否 已 经 熟悉 这 个 推荐 物品 来 评测 新 颖 度 
[9，28]， 同 时 也 可 以 通过 离线 实验 得 到 一 些 对 系统 新 颖 性 的 理解 。 在 这 样 一 个 实验 中 ， 
我 们 可 以 将 数据 通过 时 间 进 行 分 割 ， 例 如 ， 隐 藏 所 有 在 某 个 特定 时 间 点 出 现 的 用 户 评分 。 
另外 ， 我 们 可 以 隐藏 在 特定 时 间 点 之 前 的 一 些 评 分 ， 来 模拟 用 户 熟 悉 但 没有 评分 的 物品 。 
在 进行 推荐 时 ， 每 个 在 时 间 片 之 后 评分 的 被 推荐 物品 将 受到 奖励 ， 在 时 间 片 之 前 评分 的 被 
推荐 物品 将 受到 惩罚 。 

为 了 完成 以 上 过 程 我 们 必须 仔细 地 构建 隐藏 过 程 ， 这 样 我 们 可 以 模拟 真实 系统 中 偏好 
发 掘 过 程 。 在 某 些 情 况 下 ， 已 评分 的 物品 并 不 是 所 有 用 户 熟 悉 的 物品 的 平均 取样 ， 应 该 承 
认 并 处 理 这 种 偏差 。 例 如 ， 如 果 我 们 认为 用 户 会 给 某 些 特殊 的 物品 打 更 高 的 分 数 ， 给 流行 
物品 打 较 低 的 分 数 ， 那 么 这 个 隐藏 过 程 应 该 隐藏 更 多 的 流行 物品 。 i 

用 这 种 方法 计算 新 颖 度 时 ， 控 制 准确 度 是 很 重要 的 ， 因 为 无 关 的 推荐 也 许 对 用 户 来 说 
是 新 颖 的 ， 但 是 没有 意义 。 在 只 考虑 相关 的 物品 的 新 颖 度 时 有 一 个 方法 可 以 使 用 [63]。 

GED 我 们 想 要 在 离线 实验 中 评估 一 组 电影 推荐 的 新 颖 度 。 由 于 我 们 认为 系统 的 用 户 
在 看 过 电影 以 后 评分 ， 所 以 将 用 户 评分 以 一 个 连续 的 方式 进行 分 割 。 对 于 每 个 用 户 资料 ， 我 
们 沿 着 电影 评分 的 时 间 顺 序 随机 选取 一 个 分 界 点 ， 隐 藏 在 这 个 点 之 后 的 所 有 电影 。 < 

系统 的 用 户 调查 表明 人 们 并 不 倾向 于 为 他 们 没有 强烈 感觉 的 电影 打分 ， 而 偶尔 也 不 会 


为 他 们 喜欢 或 者 不 喜欢 的 电影 打分 。 因 此 ， 我 们 将 以 1 一 -二 引 的 概率 隐藏 在 分 界 点 之 前 


的 电影 评分 ， 其 中 re (1，2，3，4，5} 是 电影 的 评分 ，3 是 中 性 评分 。 我 们 要 避免 用 隐藏 
评分 预测 这 些 电 影 ， 因 为 用 户 已 经 知道 了 它们 。 

然后 ， 每 个 推荐 为 每 个 用 户 产 生 一 个 有 5 个 推荐 结果 的 列表 ， 并 且 我 们 只 在 分 界 点 之 
后 的 物品 上 计算 精确 度 。 也 就 是 ， 推 荐 系统 推荐 出 现在 分 界 点 之 前 的 具有 隐藏 评分 的 电影 
是 不 得 分 的 。 在 该 实验 中 ， 优 选 精确 度 最 高 的 算法 。 

另 一 个 评估 新 颖 推荐 的 方法 是 ， 使 用 上 述 的 假设 即 流行 的 物品 很 少 是 新 颖 的 。 因 此 ， 
我 们 可 以 使 用 这 样 的 一 种 正确 率 度量 方法 来 考虑 新 颖 度 ， 即 系统 对 于 流行 商品 的 预测 和 对 
非 流行 商品 的 预测 是 不 一 样 的 L[53]。Ziegler 等 [64] 和 Celma 和 Herrera [9] 也 提出 了 考虑 
概率 的 正确 度 评测 方法 。 

最 后 ， 我 们 可 以 将 推荐 中 新 信息 量 与 推荐 物品 之 间 的 相关 性 一 起 评估 。 例 如 ， 当 物品 
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评分 可 行 时 ， 我 们 可 以 通过 推荐 物品 的 某 个 信息 化 方法 (如 给 定 用 户 资料 的 条 件 粹 ) 乘 以 隐 
藏 评 分 来 生成 新 颖 度 分 数 。 l 


8.3.7 惊喜 度 


惊喜 度 是 成 功 推荐 的 衡量 标准 之 一 。 比 如 ， 一 个 用 户 对 特定 的 明星 演员 的 电影 给 予 积 
极 评价 ， 推 荐 该 演员 的 新 的 电影 就 是 新 颖 的 ， 因 为 用 户 可 能 还 不 知晓 ， 但 是 不 足 为 具有 惊 
喜 度 的 。 当 然 ， 随 机 推荐 也 可 能 是 惊喜 的 ， 因 此 ， 我 们 需要 在 惊喜 度 和 准确 度 中 取得 
平衡 。 

我 们 认为 惊喜 度 是 推荐 中 对 用 户 来 说 比较 新 颖 的 相关 信息 的 量 。 比 如 ， 如 果 可 以 使 得 
一 系列 用 户 喜 欢 的 演员 的 电影 进行 推荐 ， 这 就 被 认为 是 惊喜 的 。 在 信息 检索 中 ， 新 奇 性 典 
型 地 被 认为 是 在 文档 中 找到 新 的 信息 (这 最 接近 我 们 的 惊喜 度 的 定义 )，Zhang 等 [63] 建 议 
到 可 以 手动 对 一 些 文件 标记 为 宛 余 文件 。 然 后 ， 通 过 比较 算法 避免 推荐 宛 余 的 文档 。 当 一 
些 项 目 具 有 元 数据 ， 如 内 容 信 息 时 ， 就 可 以 用 于 这 样 推荐 系统 。 

为 了 避免 人 工 标记 ， 可 以 设计 一 种 项 目 之 间 基于 内 容 的 距离 测量 方式 ( 见 第 3 章 ) E 
着 可 以 对 成 功 的 推荐 进行 评分 ， 这 种 评分 主要 是 通过 之 前 的 协同 过 滤 系统 或 从 基于 内 容 推 
荐 的 用 户 模型 中 一 系列 先前 评分 项 目的 距离 中 计算 出 来 的 [62]。 因 此 我 们 对 于 一 个 成 功 的 
推荐 的 衡量 并 不 仅 是 根据 用 户 模型 。 

GED 在 一 个 图 书 推荐 应 用 中 ， 我 们 打算 从 读者 并 不 熟悉 的 作者 中 去 推荐 图 书 。 因 
此 ， 我 们 在 图 书 5b 以 及 一 系列 图 书 B( 用 户 之 前 已 经 阅读 过 的 图 书 ) 之 间 设 计 了 一 个 距离 测 
E; 定义 ceu NFEE w EB 系列 图 书 中 的 图 书 数量 。 定 义 ce = maxsu E E B 系列 图 书 
MEMRAM AE. scd, D= 6 0, geb wo) BMH OME. < 

现在 开始 运行 一 个 离线 实验 来 评估 候选 算法 可 以 产生 更 惊喜 的 推荐 。 我 们 将 每 个 受 测 
试 的 用 户 模型 分 成 一 系列 可 以 观察 的 书 B 和 隐藏 的 书 Br， 也 就 是 用 户 读 的 一 系列 书 。 我 
们 使 用 Bo 作为 每 个 推荐 的 输入 ， 然 后 得 出 一 列 5 个 推荐 。 对 于 每 个 出 现在 用 户 i 中 的 推 
荐 列表 中 的 隐藏 的 书 6€ Bt， 推 荐 一 个 分 数 4(b5，B?)。 因 此 对 于 读者 读 得 少 的 作家 ， 推 荐 
会 产生 一 些 好 的 结果 。 在 这 个 实验 中 ， 获 得 更 高 评分 的 推荐 被 选择 用 来 应 用 。 

也 可 以 认为 惊喜 度 是 “自然 预测 推荐 的 一 个 偏离 [44]。 基 于 一 个 有 较 高 准确 率 的 预测 
引擎 ， 推 荐 结果 有 些 太 “明显 ”。 因 此 ， 我 们 会 把 那些 预测 引擎 中 认为 不 可 能 的 成 功 推荐 给 
予 一 个 更 高 的 惊喜 度 分 数 。 

我 们 可 以 通过 让 一 个 用 户 去 标记 他 们 认为 非 期 望 的 推荐 结果 ， 来 评估 推荐 的 惊喜 度 ， 然 
后 我 们 可 以 尝试 发 掘 是 否 用 户 顺 从 这 些 推荐 结果 ， 这 些 推荐 使 得 用 户 未 期 望 的 和 成 功 的 推荐 
被 认为 是 惊喜 度 。 在 一 个 离线 实验 中 ， 我 们 可 以 认为 距离 测度 的 正确 性 ， 评 估 用 户 模型 的 距 
离 对 于 用 户 顺 从 的 推荐 的 影响 。 利 用 时 间 来 审视 惊喜 度 的 影响 也 是 很 重要 的 ， 因 为 用 户 可 能 
起 初 被 未 期 望 的 推荐 迷惑 了 ， 从 而 尝试 它们 。 如 果 接 下 来 他 们 发 现 推荐 并 不 是 合适 的 ， 他 们 
可 能 将 来 不 会 再 用 该 推荐 了 ， 或 者 完全 停止 使 用 这 种 推荐 引擎 。 


8.3.8 多 样 性 


多 样 性 一 般 定 义 成 相似 性 的 相反 面 。 在 一 些 情况 中 推荐 一 系列 相似 的 项 目 可 能 对 于 用 
户 没有 用 ， 因 为 它 可 能 需要 更 长 的 时 间 来 探索 范围 。 考 虑 一 个 度假 推荐 的 例子 [55]， 系 统 
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应 该 是 推荐 度假 行程 套餐 。 系 统 提出 了 5 个 推荐 ， 所 有 都 是 一 个 地 方 ， 不 同 的 仅 是 旅馆 的 
选择 或 者 景区 的 选择 ， 所 以 这 5 个 推荐 不 都 是 有 用 的 。 用 户 可 以 观看 不 同 的 推荐 地 点 ， 然 
后 寻求 对 于 他 合适 的 地 方 的 更 详细 的 信息 。 

对 于 测量 多 样 性 经 常 的 方法 是 使 用 物品 一 物品 相似 性 ， 典 型 是 基于 物品 的 内 容 ， 如 
8.3.7 节 中 所 述 。 接 下 来 ， 我 们 可 以 测量 基于 和 、 平 均 、 最 小 和 最 大 物品 列表 的 多 样 性 ， 
或 者 测量 从 已 在 列表 中 的 物品 ， 将 每 个 物品 加 到 推荐 列表 作为 新 物品 的 多 样 性 的 
值 [64，6]。 在 评价 中 ， 物 品 一 物品 相似 性 测量 与 计算 推荐 列表 的 算法 采用 的 相似 性 测量 
是 不 同 的 。 比 如 ， 我 们 可 以 用 代价 更 高 的 衡量 标准 评估 ， 得 到 更 精准 的 结果 ， 而 不 是 采用 
更 适合 在 线 计算 的 快速 近似 方法 。 

当 多 样 性 以 耗费 其 他 属性 作为 前 提 时 ， 如 准确 性 [62]， 我 们 也 可 以 计算 曲线 来 评估 准 
确 率 的 降低 和 多 样 性 的 增加 。 

GED 在 一 个 图 书 推荐 应 用 中 ， 我 们 有 兴趣 向 用 户 提供 一 组 不 同 的 建议 ， 尽 量 以 最 
小 的 影响 精度 为 代价 。 我 们 使 用 例 8. 3 中 的 a(5，B) 作 为 距离 量度 。 基 于 候选 推荐 ， 每 个 
都 含有 一 个 可 以 控制 推荐 多 样 性 的 可 调 参数 ， 我 们 训练 每 个 算法 在 多 样 性 参数 值 的 范围 。 
对 于 每 个 训练 模型 ， 我 们 按照 以 下 方法 计算 准确 的 分 数 和 多 样 性 分 数 ; 采用 一 个 算法 生成 
的 每 个 推荐 列表 ， 再 计算 每 个 物品 和 其 他 列表 中 距离 ， 计 算 平均 结果 以 便 获得 一 个 多 样 性 
分 数 。 在 一 个 图 形 中 绘制 推荐 的 准确 性 一 一 多 样 性 曲线 ， 再 选择 主导 曲线 的 算法 。 < 

在 辅助 信息 搜索 的 推荐 中 ( 见 第 18 章 )， 我 们 认为 更 加 多 样 的 推荐 将 导致 更 少 的 搜索 交 
互 [55]。 我 们 可 以 在 离线 实验 中 使 用 该 方法 来 测量 交互 序列 长 度 作 为 一 个 多 样 性 的 代表 。 由 
于 总 是 在 线 测试 ， 短 的 部 分 可 能 是 由 于 系统 的 其 他 因素 ， 为 了 证 实 这 个 假设 ， 可 以 用 实验 来 
证 明 。 即 在 对 比 不 同 推荐 之 前 ， 使 用 同样 的 预测 引擎 ， 利 用 不 同 的 多 样 性 阔 值 来 比较 。 


8.3.9 效用 


许多 电子 商务 网 站 使 用 推荐 系统 是 为 了 改善 它们 的 营销 ， 如 提高 交叉 销售 。 在 这 些 示 
例 中 ， 推 荐 引擎 可 以 通过 网 站 产生 的 收入 来 判断 [54]。 一 般 来 说 ,我 们 可 以 定义 各 种 推荐 
系统 试图 去 最 大 化 的 效用 功能 。 对 于 这 样 的 推荐 ， 衡 量 效 用 或 者 推荐 的 期 望 效 用 可 能 比 衡 
量 推荐 的 准确 性 还 要 重要 。 也 可 以 将 许多 其 他 的 属性 ， 如 多 样 性 或 “意外 发 现 ”， 看 作 效用 
功能 的 不 同类 型 。 在 本 章 中 ， 我 们 定义 效用 为 系统 或 用 户 从 一 次 推荐 中 获取 的 价值 。 

效用 可 以 从 推荐 引擎 或 推荐 系统 本 身 的 角度 来 衡量 。 要 仔细 衡量 用 户 接 到 的 推荐 的 效 
用 。 首 先 ， 用 户 效 用 或 偏好 是 很 难 捕捉 和 建 模 的 ， 很 多 研究 致力 于 此 [7，21，48]。 其 次 ， 
汇总 不 同 用 户 的 效用 去 计算 一 个 推荐 分 数 是 不 清晰 的 。 例 如 ， 用 钱 作为 一 个 效用 ， 因 此 选 
择 一 个 最 小 用 户 成 本 的 推荐 是 很 有 诱惑 力 的 。 然 而 ， 在 最 小 回报 假设 中 [56]， 对 于 不 同 收 
和信 水平 的 人 们 而 言 ， 同 样 的 钱 没 有 同样 的 效用 。 因 此 ， 如 每 个 购买 的 平均 花费 并 不 是 一 个 
聚集 用 户 的 合理 理由 。 

在 一 个 用 户 评价 物品 的 应 用 中 ， 使 用 评分 作为 效用 测量 也 是 可 以 的 [8]。 比 如 ， 在 电 
影评 分 中 ， 五 颗 星 的 评价 被 认为 是 优秀 的 电影 ， 我 们 可 以 假设 ， 相 比 于 推荐 四 颗 星 ， 推 荐 
一 个 五 颗 星 的 电影 可 以 被 认为 是 一 个 很 高 的 效用 。 由 于 用 户 具 有 对 于 评分 的 不 同 解释 ， 所 
以 在 汇总 用 户 之 前 应 该 进行 评分 的 标准 化 。 

正如 我 们 对 成 功 的 推荐 分 配 了 正 效 用 ， 也 可 以 对 不 成 功 的 推荐 给 予 效用 。 比 如 ， 如 果 
某 个 推荐 物品 冒犯 了 用 户 ， 然 后 我 们 可 以 对 该 推荐 进行 负 效 用 分 配 来 惩罚 该 系统 。 我 们 可 
以 对 于 每 个 推荐 给 予 一 定 成 本 ， 可 以 基于 列表 中 推荐 物品 的 位 置 ， 也 可 以 从 物品 的 效用 中 
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减 去 。 

对 于 任何 效用 功能 ， 推 荐 的 标准 评价 是 计算 一 个 推荐 的 期 望 效 用 。 在 推荐 系统 尝试 去 
预测 仅仅 一 个 单一 物品 时 ， 比 如 ， 我 们 基于 时 间 分 割 来 评价 系统 或 试图 预测 序列 中 下 一 个 
物品 时 ， 一 个 合适 的 推荐 值 应 该 是 物品 的 效用 。 当 推荐 系统 预测 N 个 物品 时 ， 我 们 可 以 
使 用 列表 中 正确 的 推荐 效用 总 和 。 当 对 于 不 好 的 推荐 使 用 一 个 负 效用 时 ， 就 是 对 所 有 的 推 
荐 的 总 和 ， 无 论 是 成 功 还 是 失败 的 推荐 。 我 们 可 以 将 效用 整合 到 排名 测量 中 ， 正 如 
8. 3. 2. 3 节 中 所 讨论 的 。 最 后 ， 我 们 可 以 基于 最 优 的 推荐 列表 使 用 最 大 可 能 效用 来 使 得 结 
果 评 分 标准 化 。 

说 到 推荐 效用 ， 在 用 户 调查 和 在 线 实验 情况 下 评价 效用 是 很 容易 的 。 如 果 我 们 最 大 的 
效用 是 网 站 的 收入 ， 衡 量 各 种 推荐 系统 的 用 户 之 间 收 入 变化 是 很 容易 的 。 如 果 优 化 在 线 评 
价 用 户 效 用 变 得 困难 ， 那 是 因为 用 户 发 现 对 于 结果 的 效用 分 配 是 很 难 的 。 然 而 ， 在 许多 情 
况 下 ， 用 户 可 以 说 是 否 喜 欢 一 个 结果 ， 因 此 ， 为 了 排名 候选 的 方法 ， 我 们 可 以 尝试 引出 用 
户 偏好 [26] 。 


8.3.10 风险 


在 一 些 情况 下 ， 一 个 推荐 可 能 会 被 认为 是 有 洪 在 风险 的 。 例 如 ， 当 推荐 股票 时 ， 用 户 
希望 是 规避 风险 的 ， 希 望 更 低 期 待 增长 的 股票 ， 但 是 最 好 也 是 低 风 险 的 。 另 一 方面 ， 用 户 
可 能 是 寻求 风险 的 ， 偏 爱 那些 有 潜在 高 回报 的 股票 。 在 这 种 情况 下 ， 我 们 可 能 希望 去 评价 
不 仅 从 推荐 中 产生 的 价值 ， 而 且 还 希望 能 有 最 小 风险 的 。 

标准 的 评价 风险 敏感 度 的 系统 ， 不 仅 考 虑 期 望 效 用 ， 还 有 效用 方差 ， 例 如 ， 我 们 可 以 
使 用 一 个 参数 g 比较 两 个 系统 的 E[X] 十 qg。， Var(X)。 当 g 是 负 的 时 ， 系 统 就 会 推荐 规避 
风险 的 。 


8. 3. 11 健壮 性 


稳健 性 ( 见 第 25 章 ) 是 指 在 出 现 虚假 信息 的 情况 下 推荐 的 稳定 性 [45]j， 尤 其 是 被 故意 
插入 为 了 影响 推荐 的 虚假 信息 。 随 着 越 来 越 多 的 人 依赖 推荐 系统 来 引导 他 们 ， 通 过 影响 系 
统 来 更 改 某 一 物品 的 评级 对 利害 关系 人 可 能 是 有 利 可 图 的 。 例 如 ， 酒 店 业主 希望 能 够 提高 
他 们 酒店 的 评级 。 这 可 以 通过 注入 积极 评价 本 酒店 或 者 消极 评价 竞争 对 手 的 虚假 的 用 户 信 
息 来 实现 。 

这 种 影响 推荐 的 企图 通常 被 称 为 攻击 [43，35]。 当 一 个 恶意 用 户 有 意 地 查询 数据 集 或 
者 注 人 虚假 信息 以 了 解 一 些 用 户 的 私人 信息 时 ， 协 同 攻击 就 会 发 生 。 在 评价 这 样 的 系统 
时 ， 由 于 系统 的 灵敏 度 因 协 议 的 不 同 而 不 同 ， 所 以 提供 一 个 完整 的 攻击 协议 说 明 书 是 十 分 
重要 的 。 

通常 ， 创 建 一 个 能 免除 任何 攻击 的 系统 是 不 切实 际 的 。 在 大 多 数 情况 下 ， 能 够 注入 无 
限量 信息 的 攻击 者 可 以 以 任意 的 方式 操纵 一 项 推荐 。 因此， 估计 影响 推荐 的 成 本 是 十 分 有 
用 的 ， 尤 其 是 推荐 是 由 大 量 的 注入 信息 来 决定 的 。 尽 管理 想 的 情况 是 从 理论 上 分 析 修 改 评 
级 的 成 本 ,但 是 这 并 不 总 是 可 行 的。 在 这 些 情况 下 ,我 们 可 以 通过 向 系统 的 数据 集中 导入 
虚假 信息 来 模拟 一 组 攻击 ， 实 证 测量 一 次 成 功 攻 击 的 平均 成 本 L36，10j。 

相对 于 在 这 里 讨论 其 他 的 评价 标准 ， 对 一 个 真实 系统 进行 攻击 作为 一 次 在 线 实验 是 很 
难 想象 的 。 然 而 ， 通 过 分 析 从 在 线 系统 收 集 的 真实 数据 来 识别 针对 系统 执行 的 实际 攻击 ， 
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可 能 是 有 成 效 的 。 

另 一 种 类 型 的 稳健 性 是 指 在 极端 条 件 下 的 稳定 性 ， 如 大 量 请 求 发 生 时 。 虽 然 讨论 较 
>, 但 是 这 种 稳健 性 对 系统 管理 员 是 非常 重要 的 ， 他 们 必须 避免 系统 故障 。 在 许多 情况 
下 ， 系 统 稳健 性 和 基础 设施 是 相关 的 ， 如 数据 库 软件 或 者 硬件 配置 与 可 扩展 性 也 是 相关 
的 ( 见 8. 3. 14 节 )。 


8.3.12 隐私 


在 一 个 协同 过 滤 系 统 中 ， 一 个 用 户 愿 意 去 说 出 他 的 物品 偏好 以 期 望 得 到 好 的 推荐 。 然 
后 ， 对 于 许多 用 户 来 说 ,保持 隐私 也 是 很 重要 的 ， 即 没有 第 三 方 可 以 使 用 推荐 系统 去 了 解 
一 些 特殊 用 户 的 某 些 偏好 。 

例如 ， 考 虑 一 个 用 户 非 常 喜欢 他 买 的 一 本 书 《 离 婚 的 组 织 和 计划 》， 他 的 配偶 可 能 会 被 
推荐 “ 买 这 本 书 也 会 购买 这 个 本 书 ”， 这 样 就 暴露 了 一 些 个 人 的 隐私 信息 。 

一 般 来 讲 ， 一 个 推荐 系统 泄露 私人 信息 ， 甚 至 是 个 人 隐私 ， 都 是 不 适当 的 。 出 于 这 些 
原因 ， 分析 隐 私 一 般 趋 向 于 聚焦 在 不 好 的 情景 中 ， 在 用 户 隐私 信息 可 能 泄露 的 情况 下 说 明 
了 一 些 事实 。 其 他 一 些 研究 者 [17] 通 过 评估 那些 隐私 信息 被 泄露 的 用 户 的 比例 来 比较 算 
法 。 在 这 样 的 研究 中 ， 假 设 完 全 的 隐私 是 不 现实 的 ， 因 此 我 们 必须 减少 侵犯 隐私 。 

其 他 可 代替 的 就 是 定义 不 同 的 隐私 程度 ， 如 识别 L17] 以 及 对 于 不 同 程度 的 隐私 侵犯 
去 比较 他 们 的 算法 敏感 度 。 

隐私 的 保护 需要 以 推荐 的 准确 率 作为 代价 ， 因 此 ， 必 须 在 这 之 间 寻 找 一 个 平衡 。 或 许 
最 重要 的 实验 是 ， 当 隐私 修正 被 增加 到 算法 中 时 ， 评 估 准 确 性 (或 其 他 平衡 属性 ) 可 以 需要 
或 不 需要 修正 信息 [42]。 


8.3.13 适应 性 


现实 的 推荐 系统 可 以 在 那些 物品 集 有 很 大 变化 的 环境 中 或 兴趣 趋势 经 常 改变 的 环境 中 
运行 。 或 许 最 明显 的 例子 就 是 推荐 一 个 新 物品 或 在 线 报纸 的 相关 故事 [19]。 在 这 种 情景 
中 ， 故 事 可 能 是 仅 在 短 时 间 内 有 兴趣 ， 之 后 就 会 变 得 过 时 。 当 未 预料 的 新 事件 发 生 时 ， 如 
台风 ， 人 们 会 对 这 类 事 感 兴趣 ， 也 会 对 一 些 相关 的 旧事 物 感 兴趣 ， 如 过 去 的 关于 台风 的 新 
闻 。 尽 管 这 类 问题 类 似 于 冷 启动 问题 ， 但 是 不 完全 一 样 ， 因 为 这 些 过 去 的 没有 作为 感 兴趣 
的 新 闻 如 今 变 得 让 人 感 兴趣 了 。 

这 种 类 型 的 适应 性 可 以 通过 分 析 推 荐 之 前 的 信息 数量 来 离线 评价 。 如 果 我 们 用 连续 方 
式 对 推荐 过 程 建 模 ， 我 们 可 以 记录 推荐 一 个 故事 前 的 所 需要 的 算法 证 据 。 一 个 算法 可 以 快 
速 适应 推荐 的 物品 ， 只 要 他 们 使 得 有 兴趣 就 可 以 ， 但 是 需要 牺牲 推荐 的 准确 性 。 我 们 可 以 
通过 评估 准确 率 和 趋势 改变 的 速度 之 间 的 平衡 来 比较 两 种 算法 。 

另外 一 种 适应 性 类 型 是 适应 用 户 的 个 人 偏好 进行 评分 [37]， 或 者 是 在 用 户 模型 中 改变 [34] 。 
例如 ， 当 用 户 对 一 个 物品 进行 评分 时 ， 他 们 也 期 望 一 系列 的 推荐 可 以 改变 。 如 果 推 荐 的 结 
果 保 持 不 变 ， 用 户 会 认为 他 们 的 评分 的 努力 是 一 种 浪费 ， 以 至 于 将 不 会 继续 评分 。 随 着 这 
种 趋势 评估 的 改变 ,我们 可 以 对 用 户 模 型 增加 更 多 的 信息 后 (如 新 的 评分 )， 在 离线 实验 中 
再 次 评估 这 种 推荐 列表 的 改变 。 我 们 可 以 通过 测量 推荐 列表 在 增加 新 信息 之 前 和 之 后 的 不 
同 来 评估 算法 。8. 3. 3 节 的 基尼 系数 和 香农 炉 的 例子 可 以 用 来 测量 当 用 户 模 型 变化 时 ， 对 
于 用 户 的 推荐 的 变化 。 
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8.3.14 可 扩展 性 


当 推 荐 系统 可 以 设计 成 帮助 用 户 在 大 的 物品 集合 中 进行 导航 ， 设 计 这 样 的 系统 的 目标 
的 人 也 期 望 扩 展 到 数据 集中 。 因 此 ， 通 常情 况 下 ， 算 法 用 来 蔡 换 其 他 的 属性 ， 如 ， 准 确 率 
或 覆盖 率 。 甚 至 对 于 庞大 的 数据 集 也 可 以 提供 快速 的 结果 (如 文献 [12]) 。 

随 着 数据 集 的 增长 ， 许 多 算法 要 么 变 得 缓慢 ， 要 么 需要 额外 的 资源 ， 如 计算 能 力 或 内 
存 。 一 个 突出 的 方法 是 就 所 需要 的 空间 和 时 间 来 计算 一 个 算法 的 复杂 度 [29，4]。 然 而 ， 
在 许多 情况 下 ， 两 个 算法 的 复杂 度 要 么 是 一 样 的 ， 要么 是 可 以 用 过 改变 一 些 参数 降低 复杂 
度 ， 如 模型 的 复杂 度 或 样本 大 小 。 因 此 ， 为 了 了 解 系统 的 可 扩展 性 ， 记 录 下 系统 在 大 数据 
集 下 的 系统 消耗 是 很 有 用 的 。 

可 扩展 性 的 测量 主要 是 通过 增长 的 大 数据 集 的 实验 来 获得 的 ， 当 任务 进行 扩展 时 (如 
文献 [19])， 显 示 出 速度 和 资源 的 消耗 行为 。 对 于 测量 可 扩展 性 的 支配 协调 也 是 很 重要 的 ， 
例如 ， 如 果 算法 的 准确 性 低 于 在 一 个 在 相对 的 小 数据 集 上 的 候选 算法 ， 就 要 展示 出 准确 率 
的 不 同 。 这 种 测量 可 以 在 如 特定 人 物 或 某 个 探索 方向 上 的 推荐 系统 的 潜力 表现 中 提供 重要 
的 有 价值 的 信息 。 

当 推荐 系统 期 望 在 许多 情况 下 可 以 提供 快速 的 在 线 推荐 时 ， 测 量 这 种 系统 提供 推荐 的 
速度 是 很 重要 的 [23，50]。 一 个 测量 标准 是 系统 的 吞吐 量 ， 如 系统 每 秒 提供 的 推荐 的 数 
量 。 我 们 也 可 以 测量 延迟 时 间 ， 即 在 线 推荐 所 需要 的 时 间 。 


8.4 总 结 


本 章 讨论 为 了 选择 一 个 候选 对 象 的 最 佳 推荐 算法 ， 以 及 推荐 算法 是 如 何 被 评价 的 。 这 
对 于 在 实验 中 尝试 找到 更 好 的 算法 以 及 在 为 一 个 应 用 选择 已 存在 的 算法 时 是 很 重要 的 步 
又 。 因 此 ， 许 多 评价 机 制 在 过 去 都 已 经 被 应 用 于 算法 选择 了 。 — 

我 们 同时 也 考虑 了 设计 在 线 和 离线 以 及 用 户 实验 时 的 不 同 想法 。 本 章 大 致 描述 了 一 些 
重要 的 测量 方法 ， 以 及 必须 考虑 除了 提供 的 分 数 度量 ， 也 应 该 有 在 设计 实验 时 选择 的 
算法 。 

我 们 特定 了 一 系列 属性 ， 这 些 有 时 对 推荐 系统 是 很 重要 的 ， 对 于 每 个 这 样 的 属性 ， 我 
们 都 提出 相关 实验 基于 该 属性 对 各 种 推荐 系统 进行 排名 。 对 于 少 用 的 那些 属性 ， 我 们 将 它 
们 限制 到 可 以 应 用 到 这 种 属性 的 各 种 表现 的 通用 描述 上 。 能 够 实际 实现 的 特定 程序 可 以 基 
于 我 们 的 通用 准则 为 特定 的 属性 表现 而 进行 开发 。 
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IPTV 服务 提供 商 推荐 系统 : 
一 个 大 规模 真实 产品 环境 的 应 用 





Riccardo Bambini, -Paolo Cremonesi 和 Roberto Turrin 


摘要 在 本 章 将 介绍 Fastweb, Fastweb 是 欧洲 最 大 的 网 络 电视 (IPTV) 服 务 提 供 商 之 
一 ， 在 电视 网 络 生产 环境 中 集成 了 推荐 系统 。 该 推荐 系统 同时 采用 了 协同 过 滤 和 基于 内 容 
的 技术 ， 为 了 满足 IPTV 架构 的 需要 (比如 ， 受 限 的 屏幕 设 定 、 简 化 的 导航 能 力 以 及 严格 
的 时 间 限 制 ) 做 了 适当 的 调整 。 这 些 算法 广泛 采用 线 上 线 下 测试 分 析 ， 数 据 显示 推荐 系统 
带 来 了 很 好 的 效果 : 超过 30% 的 推荐 转 为 了 购买 行为 ， 销 售 量 提升 约 1576. 


9.1 简介 


IP 电视 (IPTV) 通 过 宽带 因特网 L23，17] 以 数码 方式 传播 多 媒体 内 容 ( 如 电影 、 新 闻 报 
道 、 纪 录 片 等 ) IPTV 服务 包括 预定 电视 节目 以 及 视频 点 播 内 容 [30]。 在 本 章 其 余部 分 我 
们 将 预定 电视 节目 和 视频 点 播 内 容 统称 为 物品 。 

本 章 介 绍 Fastweb 与 Neptuny 的 ContentWise 推荐 系统 的 集成 方案 。Fastweb 成 立 于 
2001 年 ， 是 全 球 第 一 家 推出 完全 基于 IP 的 宽带 电视 服务 公司 。Fastweb 节目 单 包 含 数 千 
套 多 媒体 节目 内 容 ， 服务 着 几 十 万 IPTV 客户 。 从 2007 年 起 Fastweb 成 为 瑞士 电信 
(Swisscom) 集 团 的 一 部 分 。ContentWise 推荐 算法 是 与 米兰 理工 学 院 (Politecnico di Mila- 
no. ) 计 算 机 系 合作 共同 开发 的 。 

与 传统 的 电视 不 同 ，IPTYV 为 所 有 可 访问 的 内 容 [13j 提 供 可 交互 的 导航 服务 ， 同 时 ， 
特别 是 IPTV 能 够 收集 隐 式 的 使 用 数据 以 及 显 式 的 用 户 偏 好 数据 ， 从 而 为 用 户 提供 个 性 化 
的 导航 服务 。 用 户 通 过 一 种 特殊 的 电子 设备 一 一 机 项 盒 (STB) 一 一 与 IPTV 系统 进行 交 
互 。 机 顶 盒 所 具有 若干 特性 也 限制 了 用 户 的 交互 ， 主 要 有 : 1) 用 户 通过 遥控 器 来 控制 机 项 
盒 ， 而 遥控 器 能 执行 的 操作 很 有 限 ; 2) 电 视 中 显示 的 用 户 界面 被 设计 成 可 以 在 比 PC 和 用 
户 间 距离 更 远 的 距离 处 观看 ; 3) 这 个 系统 主要 处 理 多 媒体 内 容 ， 而 这 些 内 容 的 导航 由 于 频 
道 切 换 时 间 导 致 响应 不 够 快速 。 

与 传统 的 电 商 领域 (如 Amazon, Netflix, iTunes, IMDB, Last. fm) 所 采用 的 推荐 系 
统 不 同 ，IPTYV 推荐 系统 必须 满足 特殊 的 需求 : 

。 受 限于 屏幕 大 小 以 及 导航 能 力 较 弱 ， 推 荐 物品 列表 必须 较 少 ; 

。 必须 在 严格 的 时 间 ( 如 毫秒 级 ) 限 制 内 生成 推荐 物品 ， 因 为 电视 用 户 习 惯 于 快速 响 

应 的 系统 ; 
。 系统 需要 能 够 随 着 用 户 量 的 增长 以 及 节目 单 内 容 的 增加 进行 合理 的 扩展 ; 
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。 由 于 存在 直播 频道 ， 所 以 部 分 目录 应 是 高 度 动态 变化 的 。 

Fastweb 中 部 署 的 推荐 系统 采用 两 种 协同 过 滤 算 法 (基于 物品 间 相 似 度 以 及 降 维 技术 ) 
和 一 种 基于 内 容 的 算法 (基于 隐语 义 分 析 ) 产 生 推荐 结果 。 推 荐 系统 根据 上 下 文选 择 合适 的 
算法 。 例 如 ， 如 果 用 户 正在 读 电影 简介 ， 查 找 自 己 所 喜欢 演员 的 电影 ， 那 么 就 采用 基于 内 
容 的 算法 。 为 了 满足 严格 的 实时 要 求 ， 推 荐 系统 以 及 相应 的 算法 采用 基于 模型 的 方式 并 且 
在 逻辑 上 被 划分 为 两 个 异步 阶段 ， 批 处 理 阶段 和 实时 阶段 。 

整个 推荐 系统 架构 的 输入 数据 主要 由 两 部 分 组 成 : 1) 物 品 一 内 容 和 矩阵; 20 HP — EAR 
阵 。 物 品 一 内 容 矩 阵 (ICMD) 描 述 每 个 物品 的 主要 属性 (元 数据 )， 如 电影 标题 、 演 员 列 表 以 及 电 
影 类 型 。 用 户 一 评分 矩阵 (URMD 搜 集 用 户 关 于 物品 的 评分 (如 偏好 )。 用 户 评分 主要 是 隐 式 的 ， 
例如 ， 系 统 可 以 判断 出 一 个 用 户 是 否 看 了 某 个 节目 而 不 知道 用 户 对 该 节目 的 显 式 评价 。 

在 推荐 系统 部 署 到 生产 环境 中 前 ,已 经 通过 K 折 交 叉 验 证 进行 大 量 的 性 能 分 析 。 结 
果 显 示 对 于 基于 内 容 的 算法 的 召回 率 为 2.5% ， 而 协同 过 滤 算 法 的 召回 率 能 够 超过 20%. 

该 推荐 系统 在 2008 年 10 月 被 发 布 到 生产 环境 中 并 能 够 为 其 中 一 个 Fastweb 视频 点 播 
内 容 类 别提 供 服务 。 系 统 平均 每 天 提供 30 000 个 推荐 并 且 在 高 峰 时 期 每 分 钟 可 以 提供 120 
个 推荐 结果 。 线 上 分 析 显 示 几 乎 20% 的 推荐 能 够 转化 为 用 户 购 买 行为 。 提 升 因子 (如 VOD 
销售 量 的 增加 ) 估 计 为 15%。 

剩余 章节 安排 如 下 : 9. 2 节 描 述 一 个 IPTV 服务 的 典型 架构 。9. 3 节 描 述 推荐 系统 的 
架构 。9.4 节 描 述 实 现 的 推荐 算法 。9.5 节 描 述 Fastweb IPTV 架构 中 实现 的 推荐 服务 。 
9.6 节 评 价 推荐 质量 。 最 后 ，9. 7 节 总 结 本 章 内 容 。 


9.2 IPTV 架构 


IPTV， 又 称 为 互联 网 协议 电视 ， 是 建立 在 基于 IP 的 专用 宽带 网 络 之 上 的 视频 服务 ， 
能 够 提供 高 质量 的 传统 电视 频道 节目 和 音 视 频 点 播 内 容 。 从 终端 用 户 的 角度 看 ，IPTYV 看 
上 去 像 一 个 标准 的 电视 服务 。 在 部 署 IPTV 服务 时 ，IPTYV 提供 商 就 包括 从 有 线 和 卫星 电 
视 网 络 传输 公司 到 大 型 电话 公司 和 专 有 网 络 运营 商 。IPTV 有 以 下 独特 的 特点 [13]: 

。 支持 交互 的 电视 : 与 传统 单 向 传输 的 电视 不 同 ，IPTYV 的 双向 传输 能 力 允 许 用 户 与 

系统 进行 交互 ; 

。 时 间 位 移 : IPTV 通过 个 人 视频 录像 (PVR) 功 能 一 一 一 种 记录 并 存储 IPTV 内 容 以 

便 以 后 回放 的 机 制 一 一 支持 节目 时 间 导 航 ( 如 快 进 、 和 暂停 、 后 退 )。 
。 个 性 化 : IPTV 通过 让 用 户 自己 决定 他 们 想 看 什么 以 及 什么 时 候 看 ， 使 终端 用 户 个 
性 化 其 电视 观看 体验 。 

9. 1 表示 一 种 通用 的 IPTV 系统 架构 ， 该 架构 支持 直播 电视 频道 (也 叫 作 线性 频道 ) 
和 视频 点 播 技术 (VOD) 。 广 播 电视 服务 表现 为 用 户 同步 接收 免费 的 或 付费 观看 的 传统 电视 
频道 。 视 频 点 播 服务 表现 为 观看 由 服务 提供 商 根据 需求 定制 提供 的 多 媒体 内 容 。 

IPTV 数据 中 心 (又 叫 作 头 端 ) 从 不 同 的 数据 源 ， 包 括 地 面 载体 、 卫 星 载 体 以 及 传送 电缆 
接收 直播 频道 。 一 旦 接收 到 数据 ， 许 多 不 同 的 硬件 组 件 ， 从 编码 器 到 视频 服务 器 ， 会 被 用 于 
在 IP 网 络 传输 视频 内 容 做 准备 。 点 播 的 内 容 会 存储 在 快速 存储 盒 ( 如 固态 硬盘 ) 中 。 

机 顶 盒 (STB) 是 一 个 连接 网 络 和 家 庭 电视 的 电子 设备 ， 它 负责 处 理 接 收 到 的 信息 流 并 
将 结果 视频 显示 在 电视 上 。 用 户 通 过 手持 式 遥 控 器 与 机 顶 盒 交互 。 遥 控 器 使 用 户 能 够 操作 
机 项 盒 的 附加 功能 ， 如 电子 节目 向 导 (EPG) ， 而 该 向 导 是 一 个 在 接 下 来 的 一 段 时 间 ( 一 般 
为 36 小 时 或 更 多 ) 可 访问 的 频道 或 节目 列表 。 
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图 9.1 IPTV 系统 架构 


9.2.1 IPTV 搜索 问题 


为 了 从 大 量 的 IPTV 频道 和 内 容 中 获 益 ， 用 户 需要 快速 而 且 简单 地 查找 他 们 实际 感 兴 
趣 的 东西 ， 并 且 让 他 们 能 够 在 起 居室 的 沙发 上 休息 时 也 能 不 费力 地 做 到 这 些 ， 而 在 起 居室 
里 没有 键盘 、 鼠 标 以 及 屏幕 等 桌面 网 页 浏览 时 典型 的 设备 。 然 而 ， 对 IPTV 用 户 来 说 ， 搜 
索 直播 频道 或 点 播 视频 内 容 是 一 个 挑战 性 的 问题 [11] 。 | 

当 观 看 直播 电视 时 ， 用 户 浏览 所 有 可 观看 的 频道 直到 找到 喜欢 的 东西 。 频 道 选择 ( 跳 
过 广告 节目 ) 包 含 两 个 步骤 : 1) 浏 览 频道 内 容 来 决定 是 否 继续 或 停 下 观看 该 频道 ; 2) 切换 
不 同 的 频道 重复 浏览 直到 找到 想 看 的 频道 。 随 着 现代 IPTV 系统 提供 的 频道 数量 的 增加 ， 
快速 找到 想 看 的 频道 变 得 越 来 越 困难 。 而 且 ， 与 传统 电视 相 比 ，IPTV 由 于 受 一 些 技 术 的 
限制 [19]， 在 其 频道 切换 时 需要 一 段 时 间 ， 因 此 无 法 及 时 响应 。 

当 搜索 点 播 内 容 时 ，IPTV 用 户 通常 要 通过 一 个 复杂 的 、 预 定义 的 并 且 时 常 深层 嵌 套 
的 菜单 结构 进行 导航 ， 或 者 使 用 屏幕 键盘 或 蜗 控 器 键盘 上 三 击 输 入 框 输入 标题 。 这 些 交 互 
界面 比较 复杂 并 且 不 容易 随 着 可 获得 的 内 容 范 围 的 扩大 而 扩展 。 此 外 ， 对 于 传统 的 个 人 电 
脑 屏 幕 来 讲 ， 电 视屏 幕 分 辨 率 是 有 限 的 ， 使 得 传统 图 形 用 户 界面 难以 使 用 。 

这 区 别 于 传统 的 基于 网 络 的 领域 (如 电子 商务 站 点 )， 这 些 领 域 的 内 容 是 文本 的 ， 适 合 
信息 分 类 以 及 关键 字 检索 ， 并 且 输 入 设备 (键盘 和 鼠标 ) 允 许 在 屏幕 中 输入 任意 的 主题 同时 
容易 输入 文 本 。 

推荐 系统 与 IPTYV 基础 架构 的 整合 为 用 户 提供 了 一 种 新 的 更 有 效 的 浏览 用 户 感 兴趣 的 
节目 和 电影 的 方式 ， 从 而 提升 户 体验 。 但 是 ， 这 种 集成 必须 解决 以 下 问题 : 

。 用 户 识别 : STB 通常 被 家 庭 所 有 成 员 使 用 ，IPTYV 推荐 系统 无 法 识别 到 底 是 谁 在 

观看 某 个 节目 ; 
。 实时 要 求 : IPTV 推荐 系统 必须 在 非常 严格 的 实时 条 件 限 制 ( 几 毫秒 ) 下 生成 推荐 列 
表 以 避免 减 慢 用 户 的 导航 过 程 ， 而 该 过 程 受到 较 长 的 频道 切换 时 间 的 影响 。 

。 内 容 元 数据 质量 : 与 基于 网 络 的 领域 不 同 ， 基 于 内 容 的 IPTYV 推荐 算法 利用 低 质量 
的 元 数据 。 这 种 情况 在 直播 频道 中 尤为 明显 ， 在 直播 频道 中 每 天 都 会 以 非常 高 的 频 
率 增加 新 的 内 容 ， 唯 一 能 够 描述 这 些 节 目的 元 数据 可 以 在 电子 节目 向 导 中 找到 。 
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9.3 推荐 系统 架构 


图 9. 2 表示 Fastweb 推荐 系统 架构 ， 这 些 组 件 在 以 下 章节 中 讨论 。9. 3. 1 节 描 述 推荐 
系统 可 以 获得 的 信息 。9. 3. 2 节 描 述 推荐 算法 的 两 个 阶段 ( 批 处 理 阶段 和 实时 阶段 ) 架 构 。 
9.4 节 详细 讨论 ContentWise 系统 中 实现 的 三 种 算法 。 最 后 ，9. 5 节 描 述 将 推荐 系统 整合 
人 已 存在 的 Fastweb 架构 的 过 程 。 


数据 源 推荐 系统 网 络 服 务 


推荐 系统 算法 





[ICM | [URM 


图 9.2  ContentWise 推荐 系统 架构 


9.3.1 数据 搜集 


负责 数据 预 处 理 以 及 生成 推荐 系统 输入 的 逻辑 模块 被 称 为 数据 收集 器 。 数 据 收 集 器 从 
不 同 的 数据 源 ， 比 如 ， 有 关 直 播 节目 信息 的 电子 节目 向 导 、 视 频 点 播 内 容 信息 提供 商 以 及 
用 户 信 息 服务 提供 商 等 处 汇集 数据 。 

Fastweb 推荐 系统 不 依赖 于 用 户 的 个 人 信息 (如 年 龄 、 性 别 、 职 业 )。 推 荐 过 程 基于 用 
户 以 往 的 行为 (他 们 看 了 什么 ) 以 及 他 们 所 表达 的 显 式 偏好 (如 类 别 偏好 )。 如 果 用 户 没有 明 
确 的 偏好 ， 系 统 可 以 根据 用 户 过 去 的 活动 推断 出 其 偏好 。 

9. 2 节 提 出 了 一 个 重要 问题 : 用户 通 过 机 顶 盒 与 IPTV 系统 交互 ， 但 是 一 般 而 言 我 们 
无 法 确定 到 底 是 谁 站 在 电视 前 。 结 果 ，STB 搜集 了 一 组 用 户 的 行为 与 偏好 (比如 ， 家 庭 的 
部 分 成 员 ) 。 这 是 一 个 必须 考虑 的 问题 ， 因 为 我 们 只 能 为 每 个 STB 进行 推荐 。 为 了 简化 标 
记 ， 下 面 我 们 将 用 户 和 STB 看 作 相 同 的 实体 。 用 户 模 糊 问题 可 以 采用 将 信息 根据 时 间 片 
分 段 的 方法 部 分 解决 。 例 如 ， 我 们 可 以 粗略 地 设想 以 下 场景 : 家 庭 主妇 习惯 早上 看 电视 ， 
孩子 襄 欢 在 下 午 ， 晚 上 一 般 是 全 家 一 块 ， 而 只 有 成 人 会 在 深夜 里 看 电视 。 通 过 这 种 简单 的 
时 间 段 区 分 方式 我 们 能 够 在 同一 个 STB 中 区 分 不 同 的 潜在 用 户 。 

正常 情况 下 ， 得 到 的 信息 被 分 成 2 个 主要 的 矩阵 : 物品 一 内 容 矩 阵 (ICM) 和 用 户 一 评 
分 矩阵 (URM) ， 实 际 上 被 存储 在 关系 数据 库 中 。 

前 者 描述 了 每 个 物品 的 主要 特征 (元 数据 )。 下 面 我 们 会 将 物品 一 内 容 矩阵 记 作 研 ， 其 
中 元 素 ws 表示 特征 (元 数据 )c 和 物品 i 的 相关 性 。ICM 是 通过 分 析 内 容 提供 商 ( 如 EPG) 
所 提供 的 信息 生成 的 。 这 些 信 息 主 要 关注 电影 名 称 、 演 员 、 导 演 、 类 型 和 剧情 等 。 注 意 在 
真实 的 环境 中 ， 特 别 是 由 于 每 天 增加 新 内 容 的 比例 ， 我 们 需要 面 对 不 确定 的 信息 。ICM d 
供 的 信息 在 经 过 PoS( 词 性 7 标记， 去 除 停 用 词 以 及 隐语 义 分 析 [32] 等 技术 处 理 后 用 于 基于 
内 容 的 推荐 。 此 外 ，ICM 可 以 用 于 对 物品 进行 一 些 处 理 ( 如 父母 控制 ) 。 

URM 表示 用 户 对 物品 的 打分 (偏好 ) 。 下 面 我 们 将 该 矩阵 记 作 R， 其 中 元 素 ru RA 
P p 对 物品 i 的 打分 。 这 些 偏好 信息 构成 了 协同 过 滤 算 法 的 基本 信息 。 用 户 打 分 可 以 是 显 
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式 的 或 隐 式 的 ， 分 别 根 据 用 户 是 否 显 式 地 表达 其 偏好 或 系统 隐 式 地 搜集 进行 判断 。 

虽然 显 式 评分 会 有 偏差 [4]， 比 如 ， 用 户主 观 性 、 物 品 流行 度 以 及 全 局 评分 趋势 的 影 
响 ， 它 比较 确定 地 表示 用 户 的 观点 。 第 一 种 偏见 依赖 评分 范围 的 任意 解释 。 比 如 ， 打 分 范 
围 为 1~5， 有 些 用 户 可 能 打 3 分 表示 对 物品 感 兴趣 而 男 一 些 用 户 可 能 打 3 分 表示 不 太 喜 欢 
这 些 物品 。 类 似 地 ， 流 行 的 物品 容易 被 打 高 分 而 不 太 流 行 的 物品 容易 被 打 低 分 。 最 后 ， 显 
式 评分 容易 受 大 众 的 观点 影响 (比如 ， 用 户 更 容易 给 他 们 都 喜欢 的 电影 打分 ) 。 

另 一 方面 ， 系 统 可 以 根据 用 户 与 系统 的 交互 推断 出 用 户 的 隐 式 评分 ， 尽 管 这 些 评 分 未 
必 是 用 户 的 。 比 如 ， 系 统 能 够 监测 用 户 是 否 观 看 了 指定 频道 的 直播 节目 或 者 该 用 户 是 否 不 


间断 地 看 了 一 部 电影 。 尽 管 显 式 评 分 比 隐 式 评分 更 能 表达 用 户 对 一 个 物品 的 喜好 ， 然 而 从 - 


用 户 角度 来 看 ， 显 式 评分 的 搜集 比较 令 人 讨厌 。 

当前 部 署 的 Fastweb 推荐 系统 仅仅 搜集 隐 式 评分 ， 但 是 系统 在 隐 式 评分 与 显 式 评分 同 
时 存在 时 也 能 够 工作 。 评 分 范围 是 1 一 5， 小 于 3 的 分 值 表示 负面 评价 而 大 于 3 的 分 值 表示 
正面 评价 。 除 了 显 式 评 分 ， 系 统 通 过 监测 用 户 行 为 推断 出 的 评分 被 认为 是 正 的 (大 于 3)。 
实际 上 ， 不 论 用 户 是 否 开 始 看 某 个 节目 ， 该 节目 一 定 有 一 些 特 征 信息 (如 演员 或 类 型 ) 会 吸 
引 该 用 户 。 在 一 些 著名 的 显 式 数据 集 ， 比 如 ，Netflix 和 Movielens 中 平均 打分 大 于 3 的 事 
实证 实 了 这 个 假设 。 系 统 对 IPTV 直播 节目 和 视频 点 播 进行 不 同 的 处 理 : 

IPTV 节目 : 评分 与 用 户 播 放 时 间 ， 比 如 ， 用 户 已 经 播放 部 分 的 百分比 ， 呈 正比 例 关 
A(q18, 35D. Bit L 是 节目 的 总 时 间 ，t 是 用 户 播放 的 时 间 。 播 放 时 间 小 于 5 分 钟 的 被 
忽略 不 计 。 如 果 用 户 看 完了 整个 节目 则 分 值 为 5， 如 果 观 看 5 分 钟 则 分 值 为 3， 否 则 分 值 
为 3 一 5， 计 算 公 式 如 下 : l 





,9StsL (9. 1) 


t AL 的 单位 是 分 钟 。 

在 该 项 目的 开始 阶段 ， 主 要 的 目标 不 是 定义 准确 的 隐 式 评分 机 制 而 是 过 滤 掉 干扰 信息 
《比如 ， 跳 过 广告 节目 )。 

视频 点 播 电 影 : 当 看 一 部 电影 时 ， 用 户 被 明确 要 求购 买 和 付费 。 因 此 ， 独 立 于 用 户 播 
放 时 间 ， 每 当 用 户 请 求 观看 一 部 电影 时 ， 系 统 为 该 电影 赋予 4 分 的 隐 式 评分 。 

正如 前 面 提 到 的 ， 如 果 Fastweb 也 开始 搜集 显 式 评分 ， 他 们 在 URM 中 可 以 和 隐 式 评 
分 自然 地 共存 。 

存储 在 URM 中 的 分 值 ， 在 用 于 推荐 算法 之 前 会 减 去 一 个 常数 2. 5 进行 标准 化 。 这 使 
得 算法 能 够 区 分 正 分 值 和 负 分 值 ， 因 为 分 值 大 于 等 于 2.5( 如 3，4，5) 的 还 是 正 值 ， 而 小 
于 2.5( 如 1，2) 变 成 了 负 值 。 在 剩余 章节 我 们 假设 为 推荐 算法 输入 的 是 标准 化 的 URM。 

最 后 ， 用 户 可 以 为 他 们 想 看 的 内 容 表 达 显 式 的 人 和 偏好。 比如， 通过 图 形 界面 用 户 可 以 设 
置 他 喜欢 的 演员 。9. 4. 2 节 讨论 的 基于 内 容 的 算法 会 考虑 这 些 信息 并 使 推荐 的 电影 倾向 于 
用 户 的 偏好 。 


9.3.2 批 处 理 和 实时 阶段 


推荐 算法 处 理 9. 3. 1 节 中 提 到 的 ICM 和 URM 矩阵 ， 他 们 通过 网 络 服务 接口 与 机 顶 盒 
服务 端 对 接 ， 如 图 9.3 所 示 。 l 

为 了 满足 严格 的 实时 需求 ， 推 荐 系统 以 及 相应 算法 采用 基于 模型 的 方式 [33，9]， 例 
如 ， 他 们 首先 建立 关于 用 户 评分 和 物品 的 模型 ， 然 后 计算 推荐 结果 。 因 此 ， 算法 从 逻辑 上 
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被 划分 成 两 个 阶段 : 批 处 理 阶 段 和 实时 阶段 。 


实时 推荐 结果 





9.3 推荐 系统 : 批 处 理 和 实时 阶段 


。 批 处 理 阶段 构造 输入 数据 的 低 维 表示 (模型 ) 。 它 一 般 在 非 服务 高 峰 期 运行 ， 执 行 
频率 取决 于 新 物品 /用 户 加 入 系统 的 比例 (如 一 天 一 次 ) 。 
。 实时 处 理 阶段 利用 模型 处 理 来 自 Web 服务 接口 的 访问 并 且 满 足 实时 性 的 限制 。 系 
统 的 输出 结果 可 以 进一步 被 后 处 理 阶段 、 市 场 运营 规则 (如 推广 某 些 电影 ， 过 滤 一 
些 频 道 ) 所 约束 。 
模型 库 使 得 这 两 个 阶段 是 可 以 异步 的 ， 比 如 ， 当 实时 阶段 利用 一 个 已 有 模型 为 用 户 推 
荐 时 ， 批 处 理 阶段 可 以 同时 在 计算 一 个 新 的 模型 。 
推荐 过 程 即 使 有 了 这 样 逻 辑 的 划分 ， 由 于 输入 数据 的 大 小 、 相 关 时 间 以 及 内 存 需 求 等 
要 求 ， 在 实际 环境 中 模型 构建 仍 是 一 个 挑战 性 的 工作 。 基 于 这 个 原因 ， 我 们 实现 了 高 性 能 
的 、 并 行 的 高 要 求 矩 阵 运算 ， 并 对 大 而 稀 朴 的 矩阵 进行 了 优化 。 这 些 运算 包括 矩阵 一 矩阵 
和 和 拖 阵 一 向 量 相 乘 ， 乞 阵 转 置 ， 行 / 列 正 交 以 及 奇异 值 分 解 (svd) 。 特 别 地 ， 三 个 推荐 算法 
中 有 两 个 (一 个 基于 内 容 的 算法 ， 一 个 协同 过 滤 算 法 ) 应 用 了 svd， 大 大 降低 了 空间 维度 ， 
在 空间 复杂 度 和 时 间 复 杂 度 方面 都 有 所 提升 。 在 后 面 章 节 可 以 看 到 ， 仅 应 用 svd 定义 了 一 
个 数据 模型 ， 它 清理 了 数据 噪声 并 增强 了 相似 信息 间 的 相关 性 。 
实际 数据 集 包 含 百 万 级 的 用 户 和 物品 ， 理 论 上 他 们 的 内 存 需求 量 极 高 。 幸 运 的 是 ， 
URM 和 ICM 等 矩阵 是 稀 朴 的 。 实 际 上 ， 与 全 部 的 记录 大 小 相 比 大 部 分 用 户 只 评价 /观看 
了 一 小 部 分 物品 (比如 ， 在 节目 单数 千 套 电影 中 ， 用 户 只 看 了 其 中 一 小 部 分 ) 。 稀 朴 矩 阵 可 
以 使 用 非常 有 效 的 方式 来 处 理 。 注 意 ， 即 使 这 些 矩 阵 是 稀疏 的 ， 在 内 存 中 维护 这 些 数 据 依 
然 是 困难 的 。 由 于 这 个 原因 ， 我 们 选择 一 个 基于 一 种 内 存 虚拟 化 (类 似 于 操作 系统 的 交换 
能 力 ) 的 解决 方案 。 不 同 于 操作 系统 的 虚拟 内 存 ， 为 了 限制 内 存 与 存储 设备 间 的 数据 交换 ， 
我 们 的 虚拟 化 策略 是 针对 每 个 矩阵 的 具体 操作 进行 定制 的 。 


9.4 推荐 算法 


该 推荐 系统 实现 了 一 个 基于 内 容 的 算法 (CB) 和 两 个 协同 过 滤 算 法 (CF)。 

。 基于 内 容 隐 语义 分 析 的 算法 ， 即 LSA-CB。 

。 基于 物品 的 协同 过 滤 算法 ， 即 item-based-CF。 

。 基于 降 维 的 协同 过 滤 算 法 ， 即 SVD-CF. 

以 下 章节 我 们 简要 介绍 推荐 算法 。9. 4.2 节 一 9.4.4 节 分 别 详细 讨论 了 3 种 算法 的 实 
现 细节 : LSA, item-based 算法 和 降 维 算法 。 
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9.4.1 推荐 算法 概述 


推荐 算法 可 以 归 类 为 基于 内 容 的 算法 和 协同 过 滤 算 法 。 

基于 内 容 ( 参 考 第 3 章 ) 的 推荐 方法 根源 于 信息 检索 ， 提 供 了 许多 工具 完成 文本 信息 检 
索 ， 如 文档 、 网 站 、 新 闻 以 及 邮件 消息 。 

一 个 基于 内 容 的 系统 是 基于 对 物品 内 容 的 分 析 。 物 品 的 模型 是 由 一 组 代表 其 内 容 的 特 
征 组 成 的 。 SSP RSE A a PUN CALZEM GR Ea AE PL \ 结 为 以 
下 特点 : 

。 物品 的 每 个 特征 被 赋予 一 一 个 权 值 来 表示 其 对 物品 的 表达 能 力 ， 

。 相似 的 物品 具有 相似 的 特征 ; | 

。 包含 一 个 特征 的 物品 越 多 ， 该 特征 的 表达 能 力 越 弱 ( 例 如 ， 在 区 别 该 文物 品 与 其 他 物 

品 时 不 够 明显 ) 。 

特征 抽取 是 这 类 系统 最 关键 的 部 分 ， 它 在 IPTV 中 非常 有 挑战 性 ， 其 对 应 的 资源 是 非 
文本 的 ， 如 音频 /视频 流 。 例 如 ， 一 部 电影 的 文本 特征 可 能 是 类 型 (如 喜剧 ) 、 演 员 表 等 。 
更 多 有 趣 的 信息 可 以 通过 分 析 音 轨 得 到 ， 该 技术 [11j 是 最 近 的 技术 ， 因 此 有 必要 调查 一 下 
该 技术 是 否 会 给 IPTV 领域 带 来 一 定 的 提升 。 

物品 在 基于 内 容 的 推荐 系统 中 ， 典 型 的 表示 方法 是 词 袋 法 (BOW)[6]， 该 方法 考虑 文 
本 特征 并 且 我 们 只 保留 词 频 而 忽略 任何 语法 /语义 关系 。 通 常 这 些 词 会 经 过 分 词 、 去 除 停 
用 词 以 及 词 干 化 L32] 等 预 处 理 。 前 者 将 文本 简单 地 分 成 标记 (如 单词 ) 。 在 特定 领域 下 不 能 
有 效 表 示 物 品 的 标记 ( 停 用 词 ) 会 被 忽略 。 最 后 ， 词 干 化 通常 用 于 通过 将 标记 转化 为 其 形态 
上 的 词根 来 对 一 些 语法 变形 进行 标准 化 。 比 如 ， 单 词 “play”player” playing” 和 “played” 
会 被 转化 为 它们 的 词根 形式 “play”。 预 处 理 完成 后 ， 每 个 标记 被 赋予 一 个 权 值 ， 该 权 值 与 
词 频 成 比例 ， 词 频 可 以 通过 不 同 的 方法 标准 化 ， 而 最 常用 的 方法 是 TF-IDFL26，32] 。 

我 们 将 BOW 表示 结果 记 作 和 矩 阵 W， 其 中 每 一 列 i 表示 物品 i 而 元 素 ws 表示 物品 i 的 
元 数据 c 的 权重 (相关 性 )。 元 数据 c 可 以 是 电影 类 型 、 演 员 或 导演 ， 也 可 以 是 电影 梗概 中 
抽取 的 标记 。 我 们 将 在 9. 4. 2 节 讨 论 如 何 处 理 不 同类 型 的 元 数据 。 类 似 地 ， 用 户 模 型 也 可 
以 表示 为 标记 空间 中 的 向 量 。 实 际 上 ， 用 户 模 型 可 以 由 用 户 评 过 分 的 物品 对 应 的 线性 组 合 
向 量 进行 表示 ， 权 值 为 用 户 给 相应 物品 的 评分 。 通 过 比较 表示 用 户 模型 的 向 量 以 及 表示 物 
品 的 向 量 的 相似 度 进行 推荐 。 最 相似 的 物品 被 推荐 给 用 户 。 向 量 间 的 相似 度 可 以 由 多 种 距 
离 公式 表示 ， 如 欧 氏 距离 和 余弦 距离 [26j]。 

基于 内 容 的 推荐 系统 [1，3，21] 通 过 计算 物品 特征 ， 把 与 用 户 以 前 喜欢 过 的 物品 相似 
的 物品 推荐 给 该 用 户 。 例 如 ， 系 统 分 析 用 户 过 去 喜欢 的 电影 从 而 为 该 用 户 建立 一 个 模型 ， 
模型 特征 为 该 用 户 喜 欢 的 演员 、 制 片 人 、 电 影 类 型 和 导演 等 。 然 后 ， 与 该 用 户 偏 好 相似 度 
较 高 的 电影 被 推荐 给 该 用 户 。 比 如 ， 如 果 一 个 用 户 过 去 看 了 许多 动作 片 ， 那 么 他 会 被 推荐 
其 他 的 动作 片 。 基 于 内 容 的 推荐 系统 的 这 种 特性 有 2 个 直接 的 影响 : 它 能 够 确保 被 推荐 的 
物品 符合 用 户 的 兴趣 ， 但是， 同时 这 些 被 推荐 的 物品 是 显而易见 的 并 且 种 类 比较 单一 。 这 
个 问题 通常 被 称 为 过 度 个 性 化 问题 [3]。 

基于 内 容 的 技术 的 主要 优点 是 它们 基于 明确 的 特征 ， 因 此 可 以 为 被 推荐 的 物品 提供 直 
接 、 合 理 的 解释 ， 更 重要 的 是 ， 基 于 内 容 的 过 滤 是 基于 一 种 著名 的 、 成 熟 的 技术 。 

与 基于 内 容 的 推荐 系统 相 比 ， 协 同 过 滤 推 荐 系统 (参见 第 5 章 ) 尝 试 基于 其 他 用 户 的 偏 
好 [29，1] 向 指定 用 户 推荐 商品 。 实 际 上 ， 在 日 常生 活 中 ， 我 们 依赖 别人 的 推荐 ， 如 口 口 


210 第 二 部 分 推荐 系统 的 应 用 与 评估 


相传 或 电影 评论 。 这 类 系统 利用 集体 用 户 的 观点 帮助 个 人 有 效 地 找到 他 们 感 兴趣 的 内 容 。 
协同 推荐 系统 支持 并 增强 这 个 过 程 。 它 们 基于 以 下 2 个 假设 : 

。 许多 具有 相似 品味 的 用 户 形成 不 同 的 组 ， 他 们 对 物品 的 评价 也 相似 ; 

。 相关 的 物品 被 同一 组 的 用 户 的 评价 是 相似 的 ， 

相关 性 的 概念 与 物品 间 基 于 内 容 的 相似 性 是 非常 不 同 的 。 比 如 ， 我 们 说 一 个 电影 不 论 
它 的 内 容 是 什么 ， 它 和 另 一 部 电影 是 相关 的 因为 用 户 社区 对 这 两 部 电影 的 评价 相同 。 比 
如 ， 如 果 一 个 用 户 看 了 电影 ( 阿 甘 正 传 》， 那 么 从 协同 推荐 系统 的 角度 看 应 该 推荐 他 看 《第 
AR). 这 两 部 电影 显然 是 没关系 的 ， 因 为 从 内 容 上 看 它们 是 不 相似 的 ， 但 是 由 于 大 部 分 
看 了 电影 《 阿 甘 正 传 ) 的 人 也 看 了 《第 六 感 》， 他 们 实际 上 是 强 相关 的 。 

基于 以 上 2 个 假设 ， 我 们 可 以 定义 2 类 协同 推荐 系统 ， 分 别 是 基于 用 户 的 协同 推荐 和 
基于 物品 的 协同 推荐 [34]。 这 2 类 推荐 系统 都 是 基于 社交 互动 的 。 实 际 上 ， 由 于 性 能 较 差 
以 及 内 存 和 时 间 的 限制 ， 基 于 用 户 的 协同 推荐 系统 很 少 使 用 。 

注意 ， 协 同 推荐 不 需要 抽取 物品 的 任何 特征 。 因 此 ， 这 类 系统 没有 基于 内 容 推荐 系统 
所 具有 的 缺点 。 特 别 是 ， 由 于 协同 推荐 是 基于 其 他 用 户 的 偏好 ， 它 能 够 适用 于 任何 内 容 。 
更 重要 的 是 ， 它 能 够 推荐 任何 物品 ， 即 使 这 些 物品 的 内 容 与 之 前 喜欢 的 物品 的 内 容 完 全 不 
HX. 

然而 ， 协 同 推荐 也 有 它们 自身 的 限制 。 最 主要 的 缺点 是 协同 推荐 受到 首次 评分 问题 的 
影响 。 既 然 为 当前 用 户 推荐 与 他 喜欢 的 物品 最 相关 的 物品 ， 那 么 新 物品 就 得 不 到 推荐 ， 因 
为 没有 用 户 为 它 评价 同时 系统 无 法 为 该 物品 定义 一 个 模型 。 因 此 ， 直 到 物品 得 到 足够 多 的 
用 户 评价 ， 系 统 才 能 推荐 它们 。 由 于 这 种 原因 ， 协 同 推荐 算法 不 适用 于 直播 电视 领域 ， 因 
为 在 该 领域 中 新 节目 加 入 系统 的 比率 很 高 ， 并 且 这 些 节目 只 能 在 受 限 的 时 间 内 (如 几 小 时 ) 
展现 并 得 到 评价 。 注 意 ， 基 于 内 容 的 推荐 不 存在 这 个 问题 ， 因 为 新 节目 加 入 节目 集 后 可 以 
通过 它们 的 特征 建立 模型 。 

第 二 个 问题 是 稀 朴 性 问题 。 实 际 上 ， 协 同 推荐 的 有 效 性 依赖 于 具有 相似 偏好 的 用 户 集 
合 的 大 小 。 逮 憾 的 是 ， 在 任何 推荐 系统 中 与 要 估计 的 评价 相 比 已 获得 的 评价 是 非常 少 的 。 
因此 ， 不 太 可 能 为 只 有 单一 兴趣 的 用 户 推荐 ， 因 为 没有 其 他 用 户 与 他 是 足够 相似 的 。 | 

以 上 两 点 导致 的 结果 是 ， 在 活动 开始 阶段 ， 新 系统 无 法 提供 精确 的 推荐 ， 这 个 称 为 冷 
启动 问题 。 所 有 的 推荐 系统 ， 包 括 基于 内 容 推 荐 和 协同 推荐 系统 ， 都 存在 这 个 问题 ， 然 而 
这 个 问题 对 于 协同 过 滤 推 荐 系统 更 加 明显 ， 因 为 它 是 只 基于 用 户 评价 的 。 

另外 ， 由 于 热门 物品 最 容易 得 到 用 户 评分 ， 所 以 推荐 系统 更 倾向 于 推荐 这 些 最 热门 的 
物品 。 例 如 ， 如 果 一 部 电影 只 被 很 少 的 用 户 评分 ， 那 么 它 将 很 难 获得 推荐 ， 因 为 对 它 的 预 
测评 分 可 能 是 不 可 靠 的 。 


9.4.2 基于 内 容 隐语 义 分 析 算 法 


Fastweb 中 实现 的 基于 内 容 的 推荐 算法 是 基于 BOW 的 方法 ， 该 方法 采用 隐语 义 分 析 
来 提高 推荐 算法 的 可 靠 性 。 
参考 图 9, 2， 节 目 目录 中 每 个 物品 特征 的 检索 是 通过 数据 搜集 器 完成 的 。 这 些 特 征 经 
过 过 滤 和 加 权 后 形成 ICM。 一 个 物品 的 特征 被 分 类 到 多 个 组 ， 称 为 元 数据 。 不 同 种 类 的 物 
品 具 有 不 同 的 元 数据 集 ， 
。 视频 点 播 内 容 ， 演 员 表 、 导 演 、 制 片 人 、 标 题 、 系 列 标题 、 择 曲名 称 、 工 作 室 名 
称 、 国 家 、 年 份 、 上 上映 时 间 、 内 容 摘要 、 语 种 
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。 直播 IPTV 节目 : 演员 表 、 导 演 、 制 片 人 、 频 道 和 时 间 表 、 国 家 、 播 放 时 间 、 年 
份 、 内 容 摘要 。 

视频 点 播 内 容 与 IPTV 直播 内 容 两 者 之 间 的 最 大 不 同 是 前 者 可 以 在 任何 时 间 根 据 用 户 
需求 访问 ， 而 后 者 只 能 在 某 个 时 间 段 某 个 电视 频道 上 观看 。 推 荐 系统 必须 考虑 这 一 点 。 

对 每 个 物品 ， 元 数据 被 表示 为 字符 串 ( 如 标题 ) 或 字符 串 向 量 ( 如 演员 表 )。 根 据 元 数据 
的 种 类 ， 每 个 字符 串 被 分 别 进 行 不 同 的 预 处 理 和 加 权 。 如 果 元 数据 包含 固有 名 称 ( 如 演员 、 
导演 等 )， 我 们 不 进行 任何 处 理 而 是 保留 原 字 符 串 。 另 一 方面 ， 包 含 句子 (如 标题 和 内 容 摘 
要 ) 的 元 数据 被 分 词 、 过 滤 ( 去 除 停 用 词 ) 以 及 词 干 化 。 此 外 ， 有 些 元 数据 比 其 他 的 元 数据 
更 重要 ， 那 么 它们 会 被 赋予 更 高 的 权 值 。 通 过 交叉 验证 方式 我 们 得 到 所 有 种 类 元 数据 (如 
标题 、 内 容 摘要 、 演 员 表 、 导 演 ) 的 权 值 。 此 外 ， 内 容 摘要 中 每 个 词 干 的 权 值 被 乘 上 相应 
的 TF-IDF 值 L26，32]。 

比如 ， 我 们 考虑 一 部 包含 以 下 元 数据 的 电影 : 

。 标题 :“the title", 

。 电影 类 型 :“comedy”。 

。 演员 表 :“FirstNamel LastNamel", “FirstName2 LastName2”。 

。 内 容 简 介 :“The movies plot", 

ICM 矩阵 W 相关 的 列 的 以 下 相应 元 素 包 含 非 空 权 值 : 

° titl; 

。 电影 类 型 ; 

e FirstNamel-LastNamel ; 

。 FirstName2-LastName2; 

e Movi; 

* Plot, 

其 中 ， 演 员 和 类 型 保持 不 变 而 内 容 摘要 和 标题 被 分 词 、 词 干 化 (“titl” 是 “title” 的 词 干 ) 
以 及 去 除 停 用 词 ( 如 “the”)。 | 

除了 数据 预 处 理 ， 基 于 内 容 的 算法 性 能 也 由 于 LSA( 隐 语义 分 析 ) 得 以 提高 。LSA 一 
种 在 文档 自动 索引 和 检索 等 [16，8] 信 息 检 索 领 域 非常 著名 的 方法 。 这 种 方法 利用 了 词汇 
和 文档 的 隐 式 结构 (隐语 义 ) 。 该 技术 表现 为 将 矩阵 W 分 解 为 正 交 的 因子 集合 ， 通 过 这 些 
因子 的 线性 组 合 可 以 近似 表示 原 和 矩阵 。 和 矩阵 分 解 过 程 通过 奇异 值 分 解 (SVD) 完 成 。 

假设 ICM 是 一 个 cXn 的 矩阵 (c 个 元 数据 入 个 物品 )， 它 可 以 被 分 解 成 3 个 矩阵 UCcX 
D, SUXDIARVGXD: 

W zz USV? (9. 2) 
其 中 /1 是 物品 隐语 义 特征 个 数 。 一 般 而 言 ，/ 是 未 知 的 并 且 它 必须 通过 交叉 验证 等 技术 计 
算得 到 。S 包含 矩阵 W 的 前 7 个 最 大 的 特征 值 ， 可 以 粗略 地 认为 这 些 特 征 值 表示 每 个 隐 特 
征 的 重要 性 。U 和 V 的 列 是 正 交 的 并 且 分 别 表示 为 左右 奇异 向 量 。 根 据 Frobenius 范 
数 [25] 内 积 是 矩阵 W 最 好 的 1 阶 近似 。 注 意 ,不 考虑 三 个 结果 矩阵 行 和 列 的 线性 组 合 
SVD 是 唯一 的 并 且 按 照 惯例 ，S 的 对 角 线 元 素 是 正 的 并 按照 值 降序 排列 。 

SVD 定义 了 一 个 新 的 向 量 空间 ， 它 的 维度 不 是 c 个 元 数据 而 是 /个 隐语 义 特征 ， 其 中 
LÆNE UK). RIITELI EE W 的 相关 列 进行 投影 ( 折 释 ) 从 而 在 隐 空 间 中 表示 
hihi, MW pad, 的 投影 表示 为 

; = Ud, | (9. 3) 
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同样 ， 元 数据 c 可 以 通过 对 矩阵 W 相关 行 的 投影 在 隐 空 间 中 表示 ，W 中 投影 的 行 w。 
记 作 
w 一 w,VS (9. 4) 
图 9.4 描述 了 折 秋 过 程 。 可 以 看 到 我 们 也 可 以 将 向 量 投影 到 原本 的 空间 ， 得 到 原 向 量 
的 近似 表示 。 尽 管 LSA 是 原 BOW 空间 的 近似 表示 ， 它 有 2 个 主要 的 优点 : 

。 它 在 内 存 以 及 计算 复杂 度 上 带 来 了 很 大 的 提升 。 事 实 上 ,一旦 SVD 在 批 处 理 阶 段 
计算 完成 ， 系统 可 以 在 比 BOW 空间 更 小 的 1 维 隐语 义 定义 的 低 维 空间 中 进行 实时 
运算 。 

。 通过 保留 最 重要 的 1 个 特征 ， 我 们 去 除了 噪声 并 增强 了 物品 与 元 数据 间 的 关系 。 
比如 ， 如 果 2 个 元 数据 同时 出 现在 多 个 物品 中 ， 这 意味 着 他 们 是 相关 的 ， 那 么 它 
们 在 隐语 义 空间 中 同样 表达 类 似 的 关联 性 。 由 于 存在 隐 式 依赖 [31，16]， 这 些 相 
关 性 可 能 是 间接 的 。 


BOW 隐 空 间 





图 9.4 用户、 物品 及 元 数据 向 隐 空 间 映射 过 程 


SVD 的 主要 问题 是 其 计算 复杂 度 : 通常 情况 下 ， 一 个 mX n 的 矩阵 分 解 的 复杂 度 是 
OCmnm*)。 但 是 ， 对 于 稀 玖 矩阵 ， 则 存在 高 效 的 、 可 扩展 的 解决 方案 。 比 如 ，Lanczos[5j 实 现 
的 SVD 算法 对 稀疏 、 大 规模 矩阵 进行 了 优化 ， 用 = 表示 URM 中 非 零 元 素 的 个 数 ， 则 空间 复 
杂 度 为 O(z) ， 计 算 复杂 度 为 O(z1)( 比 如， 与 z 以 及 要 计算 的 特征 值 [36，28] 个 数 成 比例 ) 。 
Fastweb 推荐 系统 采用 了 SVD 的 Lanczos 实现 ， 能 对 接 到 多 处 理 器 架构 上 运行 。 

向 用 户 推 荐 物品 需要 计算 它们 的 相关 性 (评价 )。 因 此 ， 我 们 不 仅 将 物品 表示 在 隐 空 间 
中 ， 也 把 用 户 表示 在 相同 的 空间 中 ， 这 样 我 们 就 可 以 计算 用 户 一 物品 相关 性 。 用 户 表示 为 
一 系列 评分 ， 也 可 以 是 ICM( 如 一 个 元 数据 ) 的 一 行 ， 用 户 评分 可 以 通过 式 (9.4) 的 方式 映 
射 到 隐 空 间 ， 式 中 w 必须 被 替换 为 用 户 特征 (比如 ， 用 户 打 分 的 行 向 量 ) 。 一 旦 将 物品 和 
用 户 在 同一 个 向 量 空间 中 表示 ， 我 们 就 可 以 采用 任 一 种 向 量 间 相关 性 度量 方式 计算 物品 i 
对 用 户 p WHARE, IHE’. Fastweb 采用 的 度量 方式 是 压缩 的 余弦 距离 。 假 设 ! 维 向 量 
F, Ad 分 别 表示 用 户 和 物品 的 投影 ， 则 用 户 p 对 物品 i 的 评分 估计 值 为 


23 T» d, 
_ e=1 


OQ eee (9. 5) 


| 22047 - [DELF +y 


其 中 ，7% 表 示 向 量 7 的 第 。 STR. HH y 是 压缩 因子 ， 用 于 修正 缺失 信息 时 的 距离 ， 
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比如 ， 当 用 户 或 物品 向 量 非常 接近 原点 (比如 ， 物 品 只 有 非常 少 的 元 数据 ) 而 变 得 无 意义 。 

这 种 表示 方式 也 支持 结合 用 户 的 显 式 偏好 ， 比 如 ， 用 户 明确 表示 喜欢 的 演员 。 实 际 上 ， 
用 户 显 式 偏好 向 量 可 以 看 作 与 物品 的 元 数据 向 量 相似 。 一 旦 显 式 偏好 被 投影 到 隐 空 间 ， 投 影 
后 的 用 户 信息 与 显 式 偏好 信息 可 以 结合 起 来 表示 用 户 图 谱 ， 该 图 谱 偏 向 于 显 式 偏好 。 


9.4.3 基于 物品 的 协同 过 滤 算法 


基于 物品 的 协同 过 滤 算 法 [9，27] 采 集 物 品 间 的 基本 关系 。 根 据 9.4.1 节 的 解释 ， 若 
用 户 群 体 认 同 它们 的 评分 ， 则 两 个 物品 是 相似 的 (基于 “协同 ”的 角度 )。 这 种 相似 性 可 以 表 
示 为 一 个 mXm WBE, WED, HEPER di 表示 物品 i 和 物品 7 之 间 的 相似 性 。 注 意 ， 
D 可 能 是 不 对 称 的 (比如 ， 文 献 [9] 中 描述 的 基于 条 件 概 率 的 相似 性 )， 即 d; Adi. ABH 
着， 物品 i 可 能 非常 相似 于 物品 ;( 因 此， 如 果 一 个 用 户 喜 欢 物品 i 那么 他 也 会 喜欢 物品 
7 )， 即 使 物品 j 不 相似 于 物品 i。 

基于 物品 的 算法 将 物品 表示 在 用 户 评 分 空间 中 ， 即 一 个 物品 是 一 个 向 量 ， 其 维度 是 n 
个 用 户 的 评分 。 每 一 维 的 元 素 是 用 户 的 打分 值 。 因 此 ， 物 品 i 对 应 于 和 矩阵 R 中 的 第 i 列 并 
且 物 品 间 的 关系 由 相关 的 向 量 的 相似 性 表示 。 在 以 下 章节 介绍 多 个 计算 向 量 相 似 性 的 
技术 。 

根据 图 9. 3 表示 的 系统 架构 ， 和 矩阵 D 表示 推荐 系统 模型 并 且 其 计算 (密集 型 计算 ) 被 放 
在 系统 批 处 理 部 分 进行 。 实 时 部 分 使 用 该 模型 生成 推荐 列表 。 给 定 一 个 要 推荐 的 用 户 特 征 
(表示 为 评分 向 量 )， 我 们 可 以 通过 计算 用 户 对 与 物品 i 相似 的 物品 的 评分 进行 加 权 求 和 来 
预测 他 对 物品 i 的 评分 。 这 些 评分 由 与 物品 i 的 相似 度 加 权 。Q; 表示 与 物品 i 相似 的 物品 
集合 ， 预 测 #; 的 计算 公式 如 下 : 


Dd; * fy 
i, = T ae (9. 6) 
其 中 下 是 标准 化 因子 。 该 因子 可 以 简单 地 设 为 1 或 根据 文献 [27]， 它 可 以 如 下 计算 : 
F= $4; (9.7) 


j€Q, 

以 此 确保 7 在 预定 的 评分 范围 内 。 注 意 ， 作 为 基于 物品 方法 以 及 基于 模型 方法 ， 即 使 用 
P p 在 模型 创建 (实际 上 是 计算 物品 模型 的 批 处 理 阶段 ) 期 间 没 有 被 考虑 ， 他 也 能 够 被 推 
荐 。 这 就 允许 ，1) 使 用 用 户 的 部 分 样本 (比如 ， 为 了 满足 时 间 和 内 存 的 限制 ) 建 立 模型 ; 
2) 为 用 户 做 推荐 是 基于 计算 好 了 的 模型 ， 即 使 此 刻 他 的 特征 相对 于 模型 是 新 的 或 是 被 更 
新 了 的 。 

一 旦 计算 好 了 那些 数据 集中 没有 被 目标 用 户 评分 的 物品 的 预测 评分 ， 这 些 预测 值 会 被 
排序 并 且 分 值 最 高 的 N 个 物品 组 成 top-N 推荐 列表 。 

如 果 我 们 只 考虑 相似 度 大 于 阔 值 的 物品 或 最 相似 的 & 的 物品 ，Q:; 集合 会 减 小 。 后 一 种 
方法 是 经 典 的 ANN(CR 近邻 ) 方 法 。 根 据 9.6 节 所 讲 ， 改 变 & 值 ， 推 荐 质量 会 相应 地 改变 。 

当 使 用 隐 式 数据 集 时 ， 相 似 度 度量 是 通过 基于 频数 的 方法 计算 的 ， 该 方法 在 文献 [9] 
中 由 Deshpande 和 Karypis 论述 。 比 如 ， 我 们 仅 处 理 二 元 值 ， 物 品 i 与 物品 j 之 具有 较 高 
的 相似 度 意味 着 当 有 人 购买 了 物品 i 时 ， 他 很 可 能 也 会 购买 物品 j。 

我 们 可 以 将 每 个 物品 看 作用 户 评分 空间 (该 空间 坐标 是 二 元 值 的 ) 的 一 个 向 量 来 处 理 隐 
式 数据 。 同 样 ， 两 个 物品 间 的 相似 度 可 以 通过 计算 相应 的 向 量 得 到 ， 如 计算 余弦 距离 。 
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对 于 隐 式 评分 ， 余 弦 相 似 度 只 是 一 个 通用 的 方法 的 特例 ， 该 方法 在 后 面 称 作 直 接 关系 
(DR) 。 在 其 基本 公式 中 ， 与 DR 一 起 使 用 的 物品 一 物品 矩阵 也 为 
, D=R'-R (9. 8) 
主 对 角 线 上 元 素 di 是 物品 i 被 评分 的 总 数 ， 而 其 他 元 素 dj 表示 同时 浏览 物品 i 和 物品 
j 的 用 户 总 数 。 模 型 (如 D) 可 以 通过 后 标准 化 方式 进行 后 处 理 ， 一 般 表 达 式 如 下 [9]: 


d; 
p i 9.9 
di EI (9. 9) 


HH, y. pc 是 常量 ， 其 最 优 值 根据 数据 集 决定 。 常 量 是 压缩 因子 L14]， 当 获得 信息 
很 少 是 用 于 修正 物品 间 相 似 度 。 

该 模型 通过 使 用 RNN Ge 近邻 ) 方 法 得 以 进一步 增强 。 对 每 个 物品 ， 我 们 只 考虑 它 & 个 
最 相似 的 物品 (看 作 该 物品 的 邻居 )，& 的 取 值 可 以 通过 交叉 验证 方式 确定 。 只 保留 最 相似 
的 物品 ， 去 除了 与 目标 物品 不 相关 的 干扰 项 ， 提 高 了 推荐 结果 的 质量 。 
注意 ， 上 面 介绍 的 方法 都 是 基于 统计 共同 打分 物品 的 数量 ， 它 可 以 通过 简单 的 SQL 
语句 在 DBMS( 数 据 库 管理 系统 ) 中 高 效 地 完成 ， 而 不 需要 额外 的 编程 实现 。 


9.4.4 基于 降 维 的 协同 过 滤 算 法 


基于 降 维 技术 的 协同 过 滤 算 法 通过 有 限 的 特征 集合 来 描述 数据 (如 用 户 和 物品 )。 这 些 
特征 的 意义 与 那些 典型 的 由 基于 内 容 的 方法 抽取 的 特征 不 同 。 事 实 上 ， 后 者 是 关注 物品 内 
容 的 特征 (比如 ， 电 影 的 类 型 、 一 首 歌 的 歌手 )， 而 协同 过 滤 算 法 采用 的 特征 不 是 基于 内 容 
而 是 基于 用 户 群 与 物品 的 隐 式 交互 方式 。 

假设 一 个 物品 可 以 由 /个 特征 表示 ， 即 它 可 以 表示 为 / 维 的 特征 空间 中 的 一 个 向 量 。 同 
样 地 ， 一 个 用 户 也 表示 为 该 空间 中 的 一 个 向 量 。 因 此 ， 用 户 p 与 物品 i 间 的 相关 性 (如 物品 与 
用 户 兴趣 的 匹配 程度 ) 可 以 通过 计算 相应 比如 ， 通 过 它们 的 内 积 : 


Py = M e -bi (9. 10) 
其 中 ，ax 和 6 分 别 是 用 户 p 和 物品 i 的 第 e 个 特征 。 
目标 是 计算 /个 特征 值 使 能 最 小 化 估计 值 y 和 实际 值 之 间 预 测 误差 。 
比如 ，Paterek 在 文献 [20] 中 采用 了 一 种 优化 方法 叫 作 正则 化 奇异 值 分 解 ， 该 方法 已 
经 在 自然 语言 处 理 领 域 [12] 得 以 应 用 。 用 户 和 物品 的 i 个 特征 通过 采用 基于 梯度 下 降 的 优 
化 技术 最 小 化 RMSE 估计 ， 每 次 学 习 一 个 特征 。RMSE 度量 公式 定义 为 


RMSE — POK — ry) (9.11) 


5 LSA 相似 ,在 实现 中 再 一 次 使 用 SVD, 该 方法 也 应 用 于 URM。 实 际 上 ，URM 可 以 如 
FAM: 
R=U.S.V' (9. 12) 
其 中 ， Un XL ERM, V 是 mX1i 正 交 和 矩阵 ，S 是 包含 了 前 / 个 特征 值 的 对 角 阵 ， 其 
元 素 按 降 序 排列 。 
FAAP p 对 物品 i 的 评分 可 以 预测 为 
= Ds Se * Use (9. 13) 
HP, up EERU PSE p AT, 第 。 列 的 元 素 ; v, EREE VP. Be WMT; sh 
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EES 中 第 e 行 、 第 e 列 的 元 素 。 
假设 u, 表示 和 矩阵 U 的 第 p 41. vi 表示 和 矩阵 V 的 第 : 行 ， 式 (9. 13) 可 以 写作 : 


fy uS. y (9. 14) 
h TEE U fü V 的 列 向 量 是 正 交 的 ， 通 过 式 (9. 12) 两 边 同 乘 以 W， 得 
u,*S—r,*V (9. 15) 
其 中 ， 表 示 和 矩阵 R( 如 用 户 特征 向 量 DHA p fT. Ak, RO 14) 可 以 重新 计算 为 
fy = rV (9. 16) 


通过 式 (9. 16) 我 们 可 以 向 任何 一 个 用 户 推荐 ， 即 使 他 的 特征 是 新 的 或 者 模型 创建 后 
(如 SVD 已 经 完成 ) 他 的 特征 被 更 新 了 。 这 种 表示 大 大 优 于 其 他 降 维 技 术 ( 如 规则 化 SVD), 
其 中 指定 用 户 的 特征 在 模型 创建 过 程 中 计算 并 保持 不 变 。 
为 了 预测 用 户 p 所 有 的 评分 ， 式 (9.16) 可 以 被 直接 扩展 为 
fp =r, e VeV] (9. 17) 
注意 , VAV HARARA—-t+ mxmfifi— Whee, HEX 5 9.4.3 PHT 
物品 算法 中 讨论 的 物品 一 物品 矩阵 了 的 意义 相似 。 
与 LSA 相似 ， 采 用 这 种 基于 SVD 的 方法 有 几 个 优点 : 
。 SVD 在 一 个 低 维 空间 中 表示 用 户 和 物品 。 一 旦 和 矩阵 R 被 分 解 ( 这 个 过 程 会 带 来 很 
大 的 挑战 )， 系 统 处 理 的 只 是 2 维 的 向 量 ， 其 维度 比 n 个 用 户 和 m 个 物品 的 原始 空 
间 大 大 减 小 。 
。 SVD 去 除了 数据 中 的 噪声 。 实 际 上 ， 忽 略 掉 较 低 的 特征 值 ， 我 们 去 除了 低 信息 量 
的 数据 ， 而 这 些 数据 很 可 能 是 噪声 L10，8] 。 
。 SVD 强化 了 数据 间 的 关系 。 因 此 ， 如 果 2 个 向 量 ( 用 户 或 者 物品 ) 相 似 ( 因 为 某 些 关 
系 )， 它 们 在 / 维特 征 空间 中 的 表示 比 在 原 空间 中 离 得 更 近 。 注 意 关系 可 能 是 间接 
的 ， 通 过 SVD 可 以 发 现 用 户 或 物品 间 的 隐 依 赖 关 系 。 
参考 9. 3. 2 节 描 述 的 算法 架构 ， 和 矩阵 分 解 式 (9. 12) 由 批 处 理 部 分 完成 ， 而 评分 预测 
式 (9.16) 由 实时 处 理 部 分 完成 。 实 时 处 理 部 分 为 目标 用 户 对 所 有 未 评分 的 物品 估计 评分 ， 
然后 将 评分 排序 并 选择 N 个 最 高 的 物品 形成 top-N 推荐 列表 。 在 我 们 的 测试 中 ， 通 过 
式 (9. 16) 为 指定 用 户 计算 top-N 推荐 列表 花费 的 时 间 为 几 毫 秒 ， 符 合 实时 需求 。 


9.5 推荐 服务 
本 节 描 述 实 现 的 推荐 服务 以 及 它们 如 何 影响 用 户 界面 和 IPTV 架构 。 推 荐 系统 可 以 产 
生 基 于 内 容 的 和 基于 协同 过 滤 的 推荐 。 如 图 9.5 所 示 ， 基 VOD Live TV 


于 内 容 的 推荐 可 以 用 于 视频 点 播 和 电视 直播 领域 ， 而 协同 
过 滤 算 法 仅 用 于 视频 点 播 。 实 际 上 ， 在 9. 4. 1 节 我 们 已 经 
注意 到 协同 过 滤 算 法 在 新 内 容 不 断 添 加 的 系统 中 不 适用 ， 
并 且 只 有 当 新 节目 被 大 量 的 用 户 观看 /评价 后 协同 过 滤 算 
法 才能 推荐 。 

在 当前 整合 阶段 ，Fastweb 在 实际 发 布 之 前 将 全 部 推 
荐 服务 开放 给 选 定 的 一 部 分 测试 用 户 。 其 他 用 户 只 能 访问 。 图 9.5 推荐 算法 在 视频 点 播 
其 中 一 部 分 推荐 服务 。 图 9.6 展示 了 通过 STB 获得 的 用 和 电视 直播 中 的 应 用 
户 界 面 的 一 个 样 例 。 

目前 提供 给 所 有 用 户 使 用 的 服务 只 涉及 视频 点 播 内 容 中 的 一 个 节目 类 别 。 推 荐 结果 由 





2 





9. 4. 2 Ar d e LSA-CB 算法 提供 。 在 系统 运行 的 前 儿 个 月 更 多 地 采用 基于 内 容 的 算法 ， 
因为 根据 9. 4. 1 节 的 解释 ， 协 同 过 滤 算 法 会 他 到 冷 启 动 问题 。 此 外 ， 协 同 过 滤 推 荐 需要 记 
录用 户 行为 。 这 会 使 Fastweb 面临 一 些微 妙 的 合法 性 问题 ， 比 如 ， 需 要 获得 用 户 授 权 以 便 
存储 和 管理 他 们 的 数据 ， 并 在 确保 这 些 信息 机 密 以 及 如 名 的 情况 下 实现 解决 方案 。 
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图 9,6 METER BEN Wi 


9.6 系统 评价 


本 闻 首 先 通 过 离线 测试 计算 的 准 价 率 度 最 来 讨论 推荐 系统 的 质量 ( 见 第 8 章 )， 然后 ， 
我 们 介绍 推荐 系统 在 线 分 析 中 的 一 些 反馈 信息 ， 

离线 测试 是 基于 搜集 到 的 用 户 对 视频 点 播 中 一 个 节 上 类别 下 ?7 A AT A o A 
9. 7 显示 了 观看 数量 的 演变 。 观 看 的 平均 数量 为 每 天 1600， 而 周末 的 时 候 可 以 达到 3300。 
图 9.8、 图 9.9、 图 9. 10 通过 分 别 展示 了 活 帕 用 户 数 局 、 活 路 物品 数量 以 及 数据 集 密 译 随 
时 间 的 变化 过 程 完 成 了 分 析 。 活 跃 用户 是 指 那 些 至 少 评价 一 个 物品 的 用 户 。 同 样 ， 活跃 物 
品 是 指 至 少 被 一 个 用 户 评价 的 物品 。 数 据 集 密度 是 评价 的 总 数 与 用 户 数 和 物品 数 觅 积 的 比 
例 。 从 图 9. 10 中 我 们 注意 到 趋势 不 是 单调 的 。 实 际 上 ， 每 当 用 户 看 了 他 的 第 一 部 电影 ， 
我 们 就 有 一 个 新 的 活路 用户， 同时 数据 集 密 诬 会 下 降 。 
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图 9. 7 用 户 关 于 视频 点 播 中 一 个 类 别 的 T 个 月 的 行为 数据 中 搜集 的 观 刹 量 
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图 9.8 同一 视频 点 播 类 别 中 活跃 用 户 数量 
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图 9.9 同一 视频 点 播 类 别 中 活路 物品 数量 
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图 9. 10 同一 视频 点 播 类 别 中 评分 密度 演变 过 程 。 密 度 是 通过 考虑 观看 量 (如 评价 ) 
相对 于 活路 用 户 与 活路 物品 的 数量 计算 得 到 的 
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9. 6. 1 离线 分 析 


推荐 系统 评价 的 典型 方法 是 基于 误差 度量 (如 RMSE 和 MAE)[22] 或 分 类 精度 度量 
(如 召回 率 、 精 确 度 和 误 检 率 )[15，7]。 正 因为 我 们 只 用 了 隐 式 评价 来 表示 用 户 兴 趣 ， 实 
际 上 我 们 只 能 通过 精确 度 指标 参数 来 验证 系统 的 性 能 及 其 效果 。 最 后 ， 表 9. 1 和 表 9.2 表 
示 9.4.2 节 、9.4.3 节 和 9.4.4 节 描述 的 三 种 算法 的 召回 率 ， 算法 分 别 为 LSA-CB 算法 ， 
基于 物品 的 协同 过 滤 算 法 和 SVD 协同 过 滤 算 法 。 

召回 率 常 用 于 信息 检索 ， 它 说 明了 由 搜索 引擎 获取 的 相关 物品 的 比例 。 在 推荐 领域 ， 召 回 
率 表示 用 户 有 效 观 看 的 电影 中 由 推荐 系统 推荐 的 数量 。 为 了 达到 这 个 目的 ， 我 们 采用 留 一 法 : 

。 对 测试 集中 的 每 个 用 户 ， 选 择 一 个 评价 的 物品 。 

。 将 选 定 的 物品 从 用 户 图 谱 中 删除 ， 并 且 为 修改 后 的 用 户 图 谱 生 成 推荐 ; 过 滤 出 用 

户 已 经 评价 过 的 物品 。 
。 如 果 被 删除 的 物品 在 我 们 获得 的 推荐 列表 中 排 在 前 5 位 ， 则 表示 一 次 命中 ， 比 如 ， 用 
户 看 过 的 电影 被 推荐 算法 推荐 (根据 Fastweb 的 用 户 界 面 ， 推 荐 列表 限制 为 5 个 物品 ) 。 

。 对 每 个 用 户 的 每 个 物品 重复 以 上 过 程 。 

召回 率 表示 命中 次 数 相对 于 测试 次 数 的 百分比 。 

根据 不 同 的 算法 选择 的 测试 集 是 不 同 的 。 实 际 上 ， 基 于 内 容 的 算法 通过 ICM 建立 模 
型 ， 那 么 测试 集 可 以 是 全 部 URM。 另 一 方面 ， 协 同 过 滤 算 法 模型 是 基于 URM 本 身 ， 因 
此 我 们 通过 10 折 交 叉 验 证 方法 进行 了 评价 ， 即 我 们 将 用 户 随机 分 成 10 份 然后 其 中 一 份 用 
作 测 试 集 用 于 计算 召回 率 ， 而 剩余 的 9 份 用 于 生成 模型 。 每 一 份 测试 集 通 过 留 一 法 分 析 。 
最 终结 果 是 10 次 召回 率 的 平均 值 。 

表 9.1 列 出 了 推荐 算法 上 线 3 个 月 和 6 表 9.1 关于 指定 的 视频 点 播 类 别 的 推荐 质量 
个 月 后 的 召回 率 ， 显 示 了 系统 随时 间 的 演变 
过 程 。 此 外 ，9.4 节 描 述 的 3 个 算法 的 推荐 













质量 是 通过 一 个 简单 的 算法 进行 比较 的 , 该 ae 
算法 为 top-rated， 只 用 于 比较 目的 。top-ra- — 基于 物品 的 CF 19.0% 16.6% 





ted 算法 是 一 个 基本 的 协同 过 滤 算 法 ， 该 算 18.8% 16.5% 
法 为 每 个 用 户 推 荐 固定 长 度 的 列表 ， 该 列表 15.1% 12.7% 
由 高 流行 度 到 低 流 行 度 进行 排序 (去 除 用 户 12. 6% 13. 34 


SVD-CF 10.9% 
9.3% 


6.3% 


11.5% 
9.9% 
8.0% 


已 经 评价 的 物品 ) 。 

比如 ， 表 9.1 显示 在 算法 上 线 6 个 月 中 
最 好 的 是 基于 物品 的 协同 过 滤 算 法 ， 最 好 的 
配置 为 邻居 个 数 & 等 于 100。 从 表 9.1 中 我 
们 可 以 观察 到 一 些 特别 的 方面 : 

。 在 某 些 情况 下 ，6 个 月 后 的 推荐 质 

Etk 3 个 月 后 低 ; 

。 top-rated 算法 的 质量 是 比较 好 的 ; 

。 基于 内 容 的 算法 推荐 质量 较 差 ， 甚 至 比 top-rated 算法 还 差 。 

关于 第 一 个 观察 结果 ， 我 们 期 望 随 着 系统 搜集 评分 ， 我 们 获得 更 加 精确 的 用 户 图 谱 ， 
从 而 推荐 质量 也 会 提高 。 然 而 ， 事 实 未 必 一 直 如 此 ， 比 如 ， 根 据 文 献 [7] 中 提 及 的 一 系列 
基于 朴素 贝 叶 斯 网 络 (NBN) 的 基于 物品 协同 过 滤 算 法 的 实验 结果 。 此 外 ， 我 们 的 分 析 没 有 


top-rated 
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考虑 评分 或 物品 随时 间 变 化 的 问题 。 实 际 上 ， 如 图 9.9 所 示 ， 活 动 3 个 月 后 在 510 个 活跃 
物品 中 挑选 一 个 ， 而 6 个 月 后 有 621 个 可 供 挑选 。 由 于 部 分 反 效 应 ， 活 路 物品 在 增加 ， 用 
户 评 价 更 多 的 物品 ， 而 算法 却 忽略 了 这 些 物 品 。 无 论 如 何 ， 这 最 低 限 度 地 补偿 了 物品 增加 
效应 。 实 际 上 ， 如 图 9. 11 所 示 ， 随 着 活跃 物品 由 510 增加 到 621， 平 均 用 户 图 谱 长 度 由 每 
个 用 户 3 个 物品 增加 到 6 个 物品 。 
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图 9.11 平均 用 户 图 谱 长 度 时 间 演 变 过 程 。 图 谱 长 度 根据 视频 点 播 内 容 类 别 之 一 的 活跃 用 户 计算 

关于 第 二 个 和 第 三 个 观察 结果 ， 他 们 找到 了 一 个 通用 的 解释 。 对 于 基于 内 容 算法 的 较 
差 的 推荐 质量 以 及 top-rated 算法 较 好 的 推荐 质量 ， 部 分 是 因为 基于 留 一 法 本 身 的 测试 方 
法 。 实 际 上 ， 留 一 法 结果 的 召回 率 会 偏向 于 选择 最 流行 的 物品 算法 的 召回 率 ， 因 为 它们 数 
量 较 多 ， 所 以 更 容易 被 测试 。 基 于 内 容 的 算法 效果 非常 差 是 因为 它 忽 视 了 物品 的 流行 度 。 
另 一 方面 ，top-rated 算法 特别 有 优势 ， 是 因为 根据 文献 [7j 显 示 当 用 户 图 谱 比 较 短 (如 冷 启 
动 阶段 ) 时 ， 大 部 分 用 户 更 可 能 观看 最 流行 的 电影 。 此 外 ， 用 户 经 常 期 望 推 荐 系统 推荐 新 
奇 的 东西 ， 而 推荐 最 流行 的 物品 不 能 解决 惊喜 度 [15] 的 问题 。 





| i : ‘ H i 
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Popular items 评分 百分比 Unpopular items 


图 9.12 长 尾 效应 : 50% 的 评价 集中 于 10% ~12% HRT DW on BK) 


由 于 以 上 原因 ， 我 们 在 接 下 来 更 深层 的 推荐 算法 质量 评价 中 ， 去 除了 最 流行 的 物品 并 
且 只 根据 非 流行 物品 计算 召回 率 ， 以 应 对 著名 的 长 尾 [2] 问 题 。 图 9. 12 展示 了 流行 物品 与 
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非 流 行 物 品 的 评价 分 布 。 比 如 ， 我 们 可 以 看 到 50% 的 评价 集中 于 10% 的 最 流行 的 物品 ( 短 
头 )， 而 其 余 90% 的 物品 (长 尾 ) 只 占有 50% 的 评价 ， 一 个 实施 推荐 系统 的 主要 原因 是 提高 
长 尾 物品 的 销售 量 ， 因 为 它们 代表 了 服务 提供 商 的 潜在 收入 。 然 而 ， 推 荐 长 尾 物品 比 推荐 
短 头 物品 难得 多 。 

表 9. 2 表示 去 除了 前 10 个 最 流行 的 物品 后 的 召回 率 测 试 结果 ( 记 作 non-top-10) 以 及 去 除了 
短 头 物品 (最 流行 的 ， 它 们 代表 了 总 评价 的 50%) 的 召回 率 测试 结果 ( 记 作 non-top-50%) . 

从 表 9. 2 中 可 以 得 到 ，; 

。 基于 内 容 的 算法 质量 保持 不 变 ， 

。 当 推 荐 非 流行 物品 时 ， 协 同 过 滤 算 法 的 质量 会 下 降 ， 而 top-rated 算法 是 失败 的 ; 

。 与 基于 物品 的 协同 过 滤 算 法 相 比 ， 非 流行 物品 可 以 更 好 地 由 基于 降 维 的 协同 过 滤 

算法 推荐 。 


R92 对 视频 点 播 内 容 类 别 之 一 中 长 尾 物品 的 推荐 质量 ， 如 分 别 为 
流行 度 不 在 前 10 的 物品 以 及 评价 不 在 前 5096 的 物品 


non-top-50% 2 M3R 
ia NN unc mnl ee 
[ 4-1 | no | nz M 
giii 8. 3% 
7.9% 
14% 
11.5% 3.5% 
SvD-CF iex | now | 22% | ao% 
14% 7.8% 
11.8% 
1.7% 
duis 2.5% 
2.5% 
2.6% 
top-rated OR Lees ECC S ECL 


关于 第 一 个 观察 结果 ， 基 于 内 容 的 算法 被 证 实 不 受 物 品 流行 度 的 影响 。 

正 相 反 ， 协 同 过 滤 算 法 的 召回 率 在 下 降 。 其 中 ，top-rated 算法 的 质量 急剧 下 降 ， 而 实 
际 上 top-rated 无 法 推荐 长 尾 物 品 。 

此 外 ， 我 们 可 以 看 到 ， 推 荐 non-top-10 时 基于 物品 的 协同 过 滤 算 法 依然 是 最 好 的 。 然 
而 ， 当 我 们 关注 长 尾 (non-top-50%%) 时 ， 基 于 降 维 的 协同 过 滤 算 法 超越 了 基于 物品 的 协同 
过 滤 算 法 。 同 时 ， 我 们 也 可 以 看 到 随 着 系统 搜集 的 评价 的 增加 ， 基 于 降 维 协调 过 滤 算 法 的 
推荐 质量 呈现 正 趋势 ， 推 荐 非 流 行 物品 的 能 力也 在 提高 。 


9.6.2 在 线 分 析 


本 节 将 之 前 在 推荐 系统 离线 分 析 得 到 的 结果 与 在 线 分 析 ( 即 我 们 直接 在 运行 中 的 推荐 
系统 上 分 析 反 馈 信息 ?结合 起 来 。 根 据 9. 5 节 的 解释 ， 结 果 数 据 是 在 视频 点 播 内 容 的 一 个 
类 别 中 实施 基于 内 容 的 算法 后 得 到 的 。 

为 了 根据 经 验 评估 召回 率 ， 我 们 假设 不 论 用 户 是 在 推荐 系统 推荐 之 前 或 之 后 观看 了 一 
部 电影 ， 这 部 电影 都 是 与 用 户 相关 的 并 且 代 表 了 推荐 系统 的 一 个 成 功 推荐 。 

我 们 定义 推荐 成 功 数 ， 它 用 于 衡量 在 一 个 时 间 段 内 推荐 过 的 电影 被 观看 的 次 数 。 令 
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6(t) 表 示 推 荐 成 功 数 ，w(z) 表 示 用 户 观 看 的 电影 数 ，: 表示 推荐 的 时 间 段 ， 则 我 们 可 以 计 
算 经 验 召 回 率 为 推荐 成 功 数 与 观看 总 数 的 百分比 ， 即 


经 验 召 回 率 (1) = 2 (9. 18) 


经 验 召 回 率 表示 观看 总 数 中 被 推荐 算法 击 中 的 百分比 。 这 个 特定 的 指标 依赖 于 推荐 系统 为 
用 户 服务 的 时 间 :。 请 注意 ,一 个 很 长 的 时 间 段 t 可 能 会 放宽 推荐 和 观看 之 间 的 依赖 。 表 
9. 3 列 出 了 通过 监测 推荐 系统 2 小 时 、24 小 时 以 及 7 天 的 观看 数量 计算 出 的 系统 平均 质 
量 。 结 果 区 分 了 流行 的 物品 与 非 流 行 的 物品 。 

从 表 中 可 以 看 出 ， 相 对 于 流行 的 电影 ， 不 流行 的 电影 的 经 验 召 回 率 较 高 。 实 际 上 ， 即 
使 没有 推荐 系统 的 推荐 ， 用 户 也 已 经 知道 了 那些 流行 的 电影 。 比 如 ， 用 户 或 者 已 经 看 过 一 
部 流行 的 电影 (如 在 电影 院 ) 或 他 根本 就 不 感 兴趣 。 

进一步 分 析 ， 大 约 64% 的 成 功 推荐 是 非 流行 电影 (如 non-top 50%), MAA 36% 是 推荐 流 
行 电影 (如 top 50%)， 即 推荐 系统 更 鼓励 用 户 观 看 非 流行 的 电影 ， 这 对 于 长 尾 是 正面 效应 。 

表 9.3 测试 的 视频 点 播 内 容 类 别 的 平均 经 验 召 回 率 。 结 果 包 含 推荐 后 的 TRIER: 
(2 小 时 、24 小 时 以 及 7 天 )， 并 且 结 果 区 分 流行 物品 与 非 流行 物品 
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non-top 10 24.2% 27.6% 32.1% 
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9. 496 11.5% 

此 外 ， 我 们 通过 衡量 提升 因子 (lift factor) 来 突出 推荐 系统 的 优势 ， 提 升 因子 在 观看 数 
量 中 引信 ， 比 如， 由 于 使 用 推荐 系统 导致 观看 的 增加 量 。 一 般 来 讲 ，IPTYV 系统 的 观看 量 
依赖 用 户 群 的 数量 。 此 外 ， 我 们 也 必须 考虑 与 老 用 户 相 比 ， 新 用 户 会 看 更 多 的 电影 。 除 了 
稳定 增加 的 新 用 户 ， 我 们 还 有 随 着 市 场 营 销 而 产生 的 新 用 户 数 激增 。 图 9. 13 表示 整个 
Fastweb 用 户 群 2 年 多 的 趋势 。 陡 峭 的 部 分 与 促销 活动 有 关 。 由 于 隐私 的 原因 ， 真 实 的 用 
户 数量 被 隐藏 而 以 比例 值 代替 。 
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图 9. 13 Fastweb 用 户 数量 。 真 实 的 数量 与 列 出 的 值 成 比例 
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为 了 描述 用 户 和 观看 量 的 关系 ， 我 们 定义 了 一 个 自 回归 滑动 平均 模型 (ARMAX)， 该 
模型 输入 为 当前 用 户 群 的 大 小 和 新 用 户 的 数量 。ARMAX 模型 参数 根据 整合 ContentWise 
前 50 周 的 用 户 活动 数据 进行 估计 和 验证 。 图 9. 14 比较 了 真实 的 观看 数 和 模型 估计 的 观看 
数 。 为 了 平滑 每 天 的 变化 ， 观 看 数 根据 周 进行 聚合 。 将 数据 分 成 训练 集 和 验证 集 ， 验 证 集 
上 RMSE 结果 低 于 2%。 


每 周 观 看 数量 





1 5 10 15 20 25 30 35 40 45 50 
周 数 
图 9.14 引入 ContentWise 之 前 每 周 观看 数量 的 变化 

然后 该 模型 用 于 估计 引入 推荐 系统 后 前 20 周 的 观看 数量 。 根 据 图 9.15， 真 实 值 比 模 
型 估计 的 值 高 ， 并 且 这 个 数字 的 增加 可 以 归 因 于 推荐 系统 ， 因 为 其 他 的 潜在 因素 (比如 ， 
市 场 推广 活动 ) 也 引入 ARMAX 模型 中 。 平 均 来 说 ， 这 一 段 时 间 的 提升 因子 为 15. 5%。 





9.15 引入 ContentWise 后 每 周 观 看 数量 


最 后 ， 我 们 分 析 用 户 如 何在 选 定 的 视频 点 播 内 容 类 别 中 寻找 感 兴趣 的 内 容 。 图 9. 16 
显示 了 每 天 分 别 通 过 推荐 系统 ， 基 于 关键 字 的 搜索 引擎 以 及 字母 表 浏 览 的 搜索 请 求 数量 。 
推荐 系统 和 其 他 搜索 工具 的 请 求 差 距 说 明 用 户 有 效 地 使 用 推荐 算法 来 查找 电影 。 
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图 9.16 不 同 搜索 感 兴趣 内 容 的 途径 的 比较 : 推荐 系统 (相关 电影 )、 基 于 关键 字 的 


9. 7 总 结 


将 ContentWise 推荐 系统 整合 人 Fastweb 架构 对 用 户 和 服务 提供 商都 产生 了 积极 的 影 
响 。 源 于 在 线 分 析 中 的 三 个 主要 方面 证 实 了 推荐 系统 的 正面 影响 : 1) 用 户 更 喜欢 通过 推荐 
系统 界面 浏览 视频 点 播 内 容 类 别 ; 2) 在 较 短 的 时 间 内 ， 用 户 会 接受 并 观看 系统 推荐 的 电 


搜索 引擎 以 及 字母 表 浏 览 。 图 中 值 为 取 对 数 后 的 结果 


影 ;3) 用 户 观 看 的 电影 数 有 所 增加 。 


为 了 全 面 发 布 推荐 服务 ， 当 前 正在 通过 测试 和 调整 所 实现 的 推荐 算法 并 且 监 测 系统 冷 
启动 阶段 ， 对 Fastweb 的 其 他 类 别 进行 进一步 实验 。 其 他 正在 进行 的 工作 还 包括 应 对 从 用 


户 行为 中 估计 隐 式 评分 的 精度 问题 。 
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摘要 从 提取 数据 到 将 推荐 结果 展现 给 用 户 ， 个 性 化 系统 是 一 个 由 很 多 交互 模块 组 成 
的 复杂 系统 。 对 于 这 样 一 个 系统 的 每 一 个 部 分 ， 都 有 大 量 的 方法 、 工 具 、 算 法 和 途径 ， 如 
多 种 多 样 的 数据 处 理 方法 和 元 数据 处 理 方法 、 用 户 模型 、 过 滤 技 术 、 精 度 指标 、 个 性 化 程 
度 。 不 仅 如 此 ， 现 实 环境 中 的 推荐 系统 是 很 难 操控 的 ， 更 大 、 更 复杂 环境 的 一 部 分 一 一 通 
常 推荐 系统 只 是 一 个 更 大 的 应 用 环境 的 一 部 分 ， 而 外 部 环境 因素 对 推荐 系统 的 设计 提出 了 
更 多 限制 条 件 。 例 如 ， 数 据 格式 不 规范 ， 或 者 外 部 环境 系统 带 来 的 一 些 架构 方面 或 隐私 方 
面 的 限制 条 件 。 这 些 现 实情 况 给 推荐 系统 的 设计 带 来 更 大 的 难度 ， 并 且 很 容易 导致 失误 。 
基于 作者 的 经 验 和 对 其 他 类 似 项 目的 研究 ， 本 章 旨 在 对 个 性 化 推荐 系统 的 设计 、 实 现 和 评 
估 提 供 指 导 。 结 合 实际 经 验 ， 本 章 介 绍 了 推荐 系统 在 设计 之 初 就 应 该 考虑 的 方方面面 ， 如 
何 避 免 误 区 。 本 章 提 出 了 设计 推荐 系统 时 需要 考虑 的 主要 因素 ， 并 通过 对 实际 案例 的 研究 
对 那些 主要 因素 进行 了 说 明 ， 以 便 在 必须 面 对 许 多 复杂 的 抉择 时 协助 操作 。 


10.1 简介 


从 提取 数据 到 将 推荐 结果 展现 给 用 户 ， 个 性 化 系统 是 一 个 由 很 多 交互 模块 组 成 的 复杂 
系统 。 对 于 这 样 一 个 系统 的 每 一 个 部 分 ， 都 有 大 量 的 方法 、 工 具 、 算 法 和 途径 ， 如 多 种 多 
样 的 数据 处 理 方法 和 元 数据 处 理 方法 、 用 户 模型 、 过 滤 技 术 、 精 度 指 标 、 个 性 化 程度 等 。 
不 仅 如 此 ， 现 实 环境 中 的 推荐 系统 是 很 难 操控 的 ， 更 大 、 更 复杂 环境 的 一 部 分 一 一 通常 推 
荐 系统 只 是 一 个 更 大 的 应 用 环境 的 一 部 分 ， 而 外 部 环境 因素 对 推荐 系统 的 设计 提出 了 更 多 
限制 条 件 。 例 如 ， 数 据 格式 不 规范 ， 或 者 外 部 环境 系统 带 来 的 一 些 架构 方面 或 隐私 方面 的 
限制 条 件 。 这 些 现实 情况 使 得 建立 一 个 推荐 系统 成 为 一 项 艰巨 的 任务 。 

本 章 旨 在 对 个 性 化 推荐 系统 的 设计 、 实 现 和 评估 提供 指导 。 结 合 实际 经 验 ， 本 章 介 绍 
了 推荐 系统 在 设计 之 初 就 应 该 考虑 的 方方面面 ， 以 及 如 何 避免 误区 。 


10.2 设计 现实 环境 中 的 推荐 系统 


现 有 文献 就 建设 推荐 系统 需要 考虑 的 诸多 方面 问题 提供 了 概览 。 例 如 ， 文 献 [49] 列 举 
了 驱动 个 性 化 推荐 系统 设计 的 若干 特征 和 基本 原则 ， 如 需要 考虑 内 容 的 特殊 性 ， 用 户 信任 
和 用 户 参与 推荐 系统 的 重要 性 。 文 献 [25] 提 出 了 对 协同 过 滤 系 统 进 行 深度 分 析 的 方法 和 评 
佑 指标， 包括 推荐 系统 的 用 户 任务 分 类 方法 和 关于 数据 集 属 性 的 描述 。 这 篇 文章 对 进行 初 
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始 的 技术 选 型 非常 有 用 ， 如 用 户 建 模 和 算法 的 选择 等 。 但 如 何 确保 在 系统 设计 之 初 做 出 明 
智 的 选择 ? 这 才 是 此 时 最 需要 关心 的 问题 ， 因 为 在 后 续 开 发 过 程 任何 修改 都 将 付出 巨大 
代价 。 

为 了 系统 地 解决 这 一 难题 ， 我 们 有 必要 返回 上 一 级 ， 以 更 大 的 视角 来 看 系统 设计 中 的 
主要 设计 决策 是 什么 以 及 那些 影响 设计 决策 的 因素 。 图 10. 1 说 明了 在 本 章 中 提 到 的 方法 。 





图 10.1 推荐 环境 中 的 推荐 系统 


设计 一 个 推荐 系统 意味 着 要 在 以 下 几 个 方面 做 出 抉择 : 

。 算法 : 使 用 哪些 推荐 算法 ? 

。 架构 : 这 个 系统 如 何 部 署 ， 集 中 式 还 是 分 布 式 ? 

。 用 户 信息 : 用 户 模型 是 什么 ? 用 户 信 息 的 修正 模式 是 什么 ? 

从 大 的 方面 来 说 ， 这 些 选 择 受 限于 推荐 系统 所 处 的 外 部 环境 系统 。 因 此 ， 系 统 地 研究 
推荐 系统 置身 的 外 部 环境 是 至 关 重 要 的 。 我 们 建议 从 以 下 三 个 维度 来 描述 ， 

。 用 户 : 用 户 是 哪些 人 ， 用 户 的 目的 是 什么 ? 

。 数据 : 具体 推荐 过 程 中 所 使 用 的 数据 特征 是 什么 ? 

。 应 用 : 推荐 系统 是 整个 应 用 的 哪 一 部 分 ? 

基于 上 述 的 三 个 维度 ， 我 们 提出 了 创建 外 部 环境 的 模型 ， 并 且 在 这 些 模 型 的 基础 上 设 
计 推 荐 系统 。 

本 章 接 下 来 的 内 容 将 会 详细 阐述 这 一 过 程 。 在 10.3 节 ， 首 先 描述 了 在 开始 推荐 系统 
设计 之 前 ， 应 当 首 先 建立 的 三 个 模型 ， 并 说 明 它们 对 推荐 系统 设计 决策 的 影响 。 在 10.4 
节 ， 说 明 这 些 模型 如 何 有 助 于 推荐 系统 的 评估 。 最 后 10. 5 节 提 供 了 对 这 种 方法 的 一 个 实 
际 应 用 案例 。 


10.3 理解 推荐 系统 的 环境 


正如 在 前 面 内 容 提 及 的 ， 我 们 提出 定义 三 个 模型 (用 户 、 数 据 和 应 用 ) 。 这 些 模型 将 会 
在 决策 制定 过 程 中 协助 推荐 系统 的 设计 者 ， 帮 助 他 们 理解 所 设计 的 系统 的 主要 限制 条 件 ， 
帮助 他 们 在 以 下 三 方面 提出 正确 的 问题 ， 界 定 主要 的 限制 条 件 ， 推荐 算法 方面 的 选择 ， 推 
荐 系统 的 架构 方面 的 选择 以 及 用 户 信息 方面 的 选择 。 我 们 用 来 定义 环境 模型 的 方法 包括 定 
义 每 个 模型 的 关键 内 容 和 设计 过 程 中 提出 的 主要 问题 。 


10.3.1 应 用 模型 
尽管 推荐 系统 自身 就 是 一 个 复杂 的 软件 ， 其 本 质 是 一 个 更 大 系统 的 一 部 分 。 推荐 系统 
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仅 是 整个 应 用 的 特征 之 一 。 它 可 能 是 一 个 次 要 功能 ， 也 可 能 是 一 个 主要 的 卖点 ; 系统 应 用 
可 能 是 在 推荐 系统 之 前 就 已 经 存在 的 ， 也 可 能 是 与 推荐 系统 同期 建设 的 ， 但 无 论 如 何 ， 推 
荐 系统 设计 必须 整合 到 主体 应 用 设计 之 中 。 本 节 沿 着 两 个 主要 脉络 研究 主体 应 用 对 推荐 系 
统 设计 的 影响 : 推荐 系统 的 在 主体 应 用 中 的 角色 和 主体 应 用 的 实现 所 带 来 的 影响 。 


表 10.1 应 用 模型 
模型 的 特征 ETT 
ch 主要 业务 ， 关 注 于 “长 尾 商品 ”的 ， 增 加 收入 ， 增 加 用 户 
黏 性 ， 提 高 系统 效率 
推荐 类 型 单 物品 、 多 物品 、 列 表 
是 否 具备 导航 特征 ES 
E agga ee 每 项 性 能 目标 都 有 其 对 应 的 指标 
设备 对 应 用 的 支持 度 国定 的 、 移 动 的 、 混 合 的 
用 户 数 单个 、 群 体 
应 用 的 基础 架构 基于 浏览 的 应 用 、 分 布 式 应 用 
屏幕 空间 有 限制 的 、 无 限制 的 


10. 3. 1. 1 理解 推荐 系统 在 应 用 中 的 角色 


推荐 系统 在 整个 应 用 中 的 目标 必须 非常 清晰 ， 这 是 推荐 系统 设计 之 初 需 解 决 的 首要 问 
题 。 界 定 推 荐 系统 的 目标 通常 没有 看 起 来 的 那么 简单 ， 并 对 所 搭建 推荐 系统 类 型 具有 决定 
性 的 影响 。 需 要 研究 两 方面 的 视角 : 系统 应 用 视角 和 用 户 视角 。 它 们 有 交集 ， 但 又 彼此 独 
立 。 用 户 视角 相关 的 研究 详 见 10. 3. 2 节 。 本 节 关 注 系 统 应 用 视角 。 

推荐 目的 : 从 应 用 的 角度 来 说 ， 推 荐 系统 可 能 有 不 同 目的 ， 如 : 

。 作为 应 用 的 主要 服务 。 这 类 推荐 系统 在 不 同 领域 都 有 应 用 ， 如 音乐 网 站 (Pandora2 、 

last. fÍm9 , MyStrands® ) #1 Hi Bii (MovieLens9 , Netflix9), 

。 营销 “长 尾 ” 商 品 ， 正 如 Chris Anderson 最 先 提 出 的 那样 L[5]。 其 主要 观点 认为 ， 推 

荐 系统 大 大 降低 了 用 户 找到 所 需 商品 的 难度 ， 对 某 些 电 商 网 站 而 言 ， 这 就 是 其 商 
务 模式 的 核心 。 在 这 种 情况 下 ， 推 荐 系统 必须 关注 于 那些 很 少 有 人 问津 的 物品 ， 
将 其 准确 匹配 给 每 个 用 户 。 

。 提高 用 户 忠诚 度 : 那些 最 贴近 用 户 需 求 的 服务 会 引 来 “回头 客 ”。 用 户 参 与 推荐 过 程 可 
以 提高 用 户 忠 诚 度 (如 要 求 用 户 评分 、 用 户 手工 填写 的 信息 、 突 出 新 的 推荐 结果 等 ) 。 

。 通过 提升 特定 产品 的 销量 增加 收入 。 在 这 种 情况 下 ， 推 荐 系统 同时 由 用 户 偏 好 和 
特定 营销 目标 的 市 场 规则 所 决定 。 为 了 保证 系统 的 用 户 体验 ， 必 须 小 心 谨慎 地 权 
衡 用 户 期 望 和 商务 策略 。 

。 提高 系统 效率 。 由 于 推荐 系统 有 助 于 用 户 更 直接 地 找到 所 需 内 容 ， 推 荐 系统 可 降 
低 数 据 传 输 量 ， 从 而 降低 系统 运行 成 本 。 


Pandora Internet Radio; http://www. pandora. com 

Last FM; http: // www. last. fm 

MyStrands， 社 交 推 荐 及 发 现 : http://www. mystrands. com/ 
MovieLens， 电 影 推 荐 : http://www. movielens. org/ 
Netflix; http://www. netflix. com/ 
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推荐 类 型 : 一 个 推荐 系统 可 以 提供 多 种 推荐 类 型 ， 从 推荐 单个 物品 (或 者 简单 的 物品 
列表 ) 到 一 个 推荐 序列 (例如 ， 旅 行 推荐 系统 会 推荐 一 个 旅游 地 点 序列 ) 。 单 个 物品 或 者 列 
表 推 荐 不 用 考虑 用 户 在 某 一 时 刻 的 选择 是 否 会 影响 后 续 一 系列 选择 。 推 荐 类 型 抉择 是 由 需 
求 或 推荐 过 程 中 既 有 的 逻辑 规则 驱动 的 。 例 如 ， 在 一 个 旅行 推荐 系统 中 ， 一 次 旅行 可 以 被 
看 成 一 系列 出 游 步骤 (如 参观 博物 馆 、 去 海滩 等 )， 这 些 步 又 可 以 通过 像 地 理 、 文 化 、 历 
史 、 休 闲 等 多 种 逻辑 特征 组 合 起 来 ， 以 构成 好 的 旅行 体验 。 当 用 户 刚 进 入 一 个 新 的 领域 ， 
并 且 需 要 在 多 种 物品 中 选择 一 条 最 佳 路 径 以 实现 其 个 人 发 展 目标 时 ， 推 荐 序列 可 能 会 相当 
有 用 : 推荐 结果 的 逻辑 次 序 是 按照 用 户 的 学 习 曲 线 展 开 的 ， 即 按照 用 户 最 容易 理解 的 方式 
提供 最 适合 的 下 个 行动 步 又。 符合 逻辑 的 推荐 结果 通过 提供 下 一 步 最 适合 的 步骤 来 帮助 他 
们 完成 自己 的 学 习 路 线 。 遗 憾 的 是 ， 至 今 推荐 序列 方面 的 研究 成 果 很 少 。 我 们 正在 就 此 进 
行 一 些 研 究 ， 也 可 能 会 用 到 一 些 来 自 数据 挖掘 领域 的 技术 ， 如 Apriori 关联 规则 算法 [2] 。 
整合 内 容 导 航 功 能 : 另 一 个 需要 研究 的 重点 是 ， 推 荐 结果 如 何 与 其 他 内 容 导 航 功 能 进 
行 整合 。 大 多 数 情况 下 ， 除 了 获得 推荐 结果 ， 用 户 还 有 很 多 种 方式 浏览 内 容 。 内 容 导 航 功 
能 有 效 整 合 能 够 极 大 地 改善 用 户 体验 。 
。 用 户 可 能 会 将 请 求 推荐 和 浏览 内 容 两 种 行为 完全 分 开 。 如 果 推 荐 是 应 用 的 核心 功能 ， 
这 种 情况 可 能 是 很 不 错 的 选择 。 这 类 推荐 功能 通常 出 现在 网 站 首页 或 者 应 用 首 屏 中 。 
。 根据 当前 交互 的 上 下 文 进行 的 推荐 也 是 大 有 神 益 的 。 典 型 情况 是 推荐 与 用 户 当 前 
浏览 内 容 相似 的 物品 。 此 时 ， 推 荐 系统 提供 的 推荐 结果 能 够 匹配 当前 交互 的 上 下 
文 ， 如 当前 浏览 音乐 类 型 。 
。 另外 一 个 要 考虑 的 重点 是 推荐 系统 在 当前 交互 模式 中 属于 可 选 的 还 是 强制 的 。 因 
为 这 会 严重 影响 系统 的 预期 可 靠 性 : 如 果 推 荐 系统 成 为 网 站 中 完成 某 种 任务 的 唯 
一 方式 ,一 旦 推荐 结果 不 准确 ， 推 荐 系统 就 成 为 导致 用 户 满意 度 降低 的 主要 原因 。 
然而 在 推荐 系统 设计 中 ， 推 荐 系统 通常 与 传统 的 多 种 站 内 导航 方式 同时 存在 ， 推 
荐 系统 对 整个 系统 的 负面 影响 可 就 大 大 降低 了 。 
性 能 标准 : 一 旦 明确 了 上 述 目 标 ， 就 可 以 依据 大 量 的 指标 来 定义 系统 的 性 能 目标 。 这 
些 指标 不 但 可 以 用 来 评估 推荐 系统 ， 也 是 选择 合适 算法 的 关键 。 有 很 多 指标 可 以 使 用 ， 文 
献 [25] 提 供 了 对 许多 可 行 的 指标 的 一 个 全 面 的 参考 。 一 些 关 键 的 指标 包括 : 
。 正确 性 指标 (correctness metrics): 如 精确 度 (Accuracy)、 准 确 率 (Precision) Al A 
回 率 (Recall) : 这 些 是 用 来 评估 推荐 算法 的 技术 性 指标 ， 一 直 是 推荐 系统 研究 的 关 
注重 点 。 然 而 ， 这 些 指标 实际 上 不 足以 评估 用 户 满意 度 [33]。 
。 透明 度 和 可 解释 性 (transparency and explanability): 对 于 推荐 系统 而 言 ， 让 用 户 
理解 推荐 结果 是 如 何 产生 的 到 底 有 多 重要 ? 对 某 些 算法 来 说 ， 实 现 高 透明 度 是 尤 
其 困难 的 。 例 如 ， 协 同 过 滤 算 法 本 质 上 是 很 难 透 明 的 ,文献 [24] 只 提供 了 对 问题 
的 分 析 和 部 分 解决 方案 。 
。 惊喜 度 (serendipity) : 用 户 会 不 会 对 一 些 推 荐 结果 感到 喜出望外 ， 或 者 哪些 显 而 易 
”” 见 的 推荐 是 用 户 想 要 的 ? 经 典 的 协同 过 滤 算 法 倾向 于 推荐 那些 非常 热门 ， 可 能 被 
认为 是 非常 明显 的 ， 对 大 多 数 用 户 没 什么 用 处 的 物品 。 现 存 技术 已 经 能 够 纠正 这 
一 倾向 ， 详 见 文献 [25] 。 
。 风险 控制 (risk taking): 与 前 述 指标 有 关 ， 推 荐 系统 是 否 只 能 推荐 出 那些 与 用 户 偏 
好 高 度 相 关 的 物品 ? 如 果 推 荐 的 目的 是 帮助 用 户 发 现 那些 在 没有 系统 帮助 的 情况 
下 用 户 不 可 能 知道 的 内 容 ， 那 么 更 高 风险 的 物品 也 是 可 以 被 推荐 的 。 
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。 响应 速度 /性 能 (response speed/performance): 在 很 多 时 候 ， 应 用 的 反应 能 力 是 主 
要 的 关注 点 ， 有 时 甚至 比 推荐 结果 的 准确 度 更 重要 。 了 解 推 荐 系统 要 使 用 的 单位 
时 间 ， 有 助 于 更 好 地 选择 算法 或 决定 推荐 结果 是 否 应 该 预先 计算 。 
。 可 靠 性 (reliability): 在 既定 应 用 环境 中 ， 推 荐 系统 的 输出 关键 是 什么 ? 例如 ， 一 
个 电子 商务 网 站 的 推荐 系统 设计 肯定 不 适 于 医疗 系统 中 的 器 官 捐赠 配 型 系统 。 
。 应 对 攻击 的 健壮 /健壮 性 (robustness to attack): 尤其 是 ， 具 有 商业 色彩 (如 推荐 产 
品 的 购买 ) 的 推荐 系统 ， 为 影响 推荐 结果 ， 它 很 有 可 能 受到 攻击 。 文 献 [34] 对 推荐 
系统 中 有 可 能 的 攻击 进行 了 详尽 的 分 析 ， 并 提供 了 针对 协同 过 滤 算 法 的 若干 解决 
办 法 。 
10.3.1.2 理解 应 用 实现 的 影响 
除了 用 户 可 见 的 特征 ， 应 用 实现 过 程 中 的 一 些 方面 也 对 推荐 系 的 设计 有 很 大 影响 。 
单一 或 多 种 终端 设备 : 同一 应 用 可 能 通过 单一 或 者 多 种 终端 设备 进行 访问 (例如 ， 一 
个 新 闻 推 荐 系统 可 支持 手机 、 个 人 电脑 、 机 项 盒 ) 。 必 须 考 虑 推荐 结果 是 否 是 基于 用 户 语 
境 的 (参见 10. 3. 2 节 ) 。 但 就 实现 过 程 而 言 ， 随 之 而 来 的 一 些 问题 是 : 用 户 偏好 信息 是 与 
基于 语 境 的 推荐 融合 呢 ， 还 是 作为 独立 因素 支撑 基于 语 境 的 推荐 ? 用 户 偏好 信息 存储 在 何 
处 ? 如 果 用 户 偏好 信息 存储 在 服务 器 中 ， 那 么 向 服务 器 传输 是 实时 的 (意味 着 持续 调用 ) 还 
是 批量 更 新 ? 即使 应 用 程序 设计 之 初 不 支持 多 种 设备 ， 这 些 问 题 还 是 相当 重要 的 ， 因 为 从 
Web 应 用 程序 衍生 出 手机 版 本 已 经 变 得 顺理成章 。 
单个 或 多 个 用 户 : 相反 ， 同 一 种 终端 设备 可 能 被 多 个 用 户 使 用 。10. 3. 2 节 已 经 讨论 
过 用 户 社会 环境 的 影响 。 此 外 ， 与 个 性 化 应 用 进行 交互 的 用 户 可 能 是 注册 用 户 也 可 能 是 匿 
名 用 户 ， 用 户 的 交互 频率 是 偶尔 或 者 经 常 。 这 方面 的 因素 都 将 影响 推荐 系统 的 架构 (不 同 
的 交互 情况 意味 着 不 同 的 识别 用 户 方法 ， 例 如 ， 是 根据 登录 还 是 通过 cookie 识别 )、 算 法 
选择 (例如 ， 对 匿名 的 临时 访客 采用 对 话 (session) 识 别 的 方法 ， 对 注册 用 户 使 用 用 户 信息 ) 
以 及 算法 参数 (例如 ， 系 统 对 用 户 的 适应 程度 也 就 是 用 户 信息 的 适 配 速度 : 短期 或 者 
长 期 ， 取 决 于 用 户 访问 频率 ) 。 
应 用 程序 基础 架构 : 应 用 程序 的 基础 架构 限定 了 推荐 系统 可 使 用 的 算法 类 型 和 推荐 系 
统 的 一 些 特殊 实现 方式 。 尤 其 是 ， 在 可 扩展 性 方面 需要 慎重 考虑 。 两 种 可 识别 的 主要 场景 
是 : 基于 用 户 浏览 的 应 用 和 通过 终端 本 地 程序 的 应 用 。 
。 基于 浏览 的 应 用 (browser-based application) 。 在 基于 浏览 应 用 的 情况 下 ， 客 户 端 
的 进程 几 可 忽略 不 计 。 单 点 可 调用 全 部 现 有 信息 ， 可 以 使 用 任何 算法 。 然 而 ， 系 
统 的 扩展 性 是 设计 时 的 主要 关注 点 。 
。 分 布 式 应 用 (distributed application), 。 当 用 户 终端 通过 本 地 程序 接 人 推荐 系统 时 ， 
可 能 会 使 用 不 同 的 架构 。 为 了 找 出 最 适合 的 分 布 式 架构 ， 需 要 考虑 以 下 准则 : 
m 相关 设备 的 处 理 能 力 。 客 户 端 设 备 能 否 支持 密集 型 任务 ? 服务 端的 计算 资源 能 
否 随 用 户 数 增长 按 需 扩展 ? 
m 网 络 连通 性 。 网 络 连通 是 否 是 永久 的 ? 用 户 要 为 数据 传输 付出 代价 吗 ? 对 移动 
设备 而 言 ， 网 络 连接 对 电池 续航 能 力 的 影响 是 什么 ? 
' m 数据 源 。 如 何 访 问 提取 出 来 的 推荐 结果 ?是 从 数据 库 ( 信 息 检索 ) 还 是 从 数据 流 
(信息 过 滤 ) 中 提取 ? E 
内 容 过 滤 算 法 可 完全 运行 在 终端 设备 上 。 这 样 做 的 好 处 有 : 因为 无 须 传输 用 户 个 人 信 
息 ， 隐 私 得 到 了 保护 ;架构 的 扩展 性 非常 好 ， 因 为 用 户 数 对 服务 器 负载 的 影响 很 小 。 另 一 
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方面 ， 像 协同 过 滤 这 样 的 算法 则 需要 校 验 全 量 用 户 或 大 量 用 户 的 数据 。 在 这 种 情况 下 ， 一 
个 完全 的 集中 式 架 构 可 能 更 合适 ， 和 基于 浏览 器 的 应 用 具有 一 样 的 优 缺 点 ， 只 是 需要 特别 
考虑 基于 客户 端 应 用 的 数据 更 新 机 制 。 更 复杂 的 架构 也 是 可 行 的 ， 如 TiVo 电视 节目 推荐 
系统 [3]。 在 这 个 系统 中 ， 服 务 端 进行 部 分 计算 ， 其 余 的 计算 是 在 每 个 机 顶 盒 (客户 端 ) 完 
成 的 。 其 他 的 复杂 架构 包括 分 布 式 配置 管理 [13]， 或 确保 在 不 同 的 终端 上 运行 的 推荐 系统 
进行 会 话 的 机 制 [28]。 基 础 架构 的 选择 也 可 能 受到 与 其 相连 的 系统 其 他 组 件 的 影响 ， 如 外 
部 网 络 服务 。 

屏幕 空间 : 设计 初期 很 容易 被 忽略 的 一 点 就 是 推荐 系统 将 用 于 多 大 的 屏幕 空间 。 大 多 
数 情况 下 ， 屏 幕 空间 是 非常 有 限 的 ， 并 且 受 到 应 用 的 UI 设计 的 限制 。 这 不 仅 是 一 个 量化 
议题 ， 并 且 对 所 提供 的 推荐 结果 的 本 质 有 影响 。 例 如 ， 假 设 推 荐 系统 试图 提供 偏向 于 探索 
性 的 推荐 结果 ， 那 么 必然 要 有 足够 的 屏幕 空间 以 展示 足够 多 的 推荐 结果 。 在 向 用 户 展示 推 
荐 描述 的 环节 中 也 面临 同样 的 问题 ， 文 献 [40] 提 供 了 一 种 在 小 型 设备 上 展示 用 户 配 置 的 解 
决 方案 。 

研究 推荐 系统 的 应 用 仅 是 了 解 推荐 系统 设计 的 一 系列 限制 条 件 的 开始 ， 只 了 解 这 些 还 
不 足以 建立 一 个 合适 的 推荐 系统 ， 还 需要 掌握 更 多 关于 用 户 和 数据 的 知识 。 


10.3.2 用 户 建 模 


充分 理解 用 户 是 任何 推荐 系统 成 功 的 基石 。 对 最 终 用 户 进行 深入 的 研究 以 便 用 户 建 模 
的 工作 在 开发 周期 中 应 该 早点 开始 。 用 户 建 模 是 推荐 系统 设计 决策 过 程 中 ， 影 响 技术 选择 
的 关键 因素 。 在 任何 项 目的 初始 阶段 就 采纳 以 用 户 为 中 心 的 方法 ， 都 能 极 大 减少 有 关 大 规 
模 的 重 构 、 系 统 维护 和 用 户 支持 的 需求 [9，22] 。 


本 节 提出 通过 那些 可 能 对 推荐 系统 — ar 
的 设计 和 设计 者 所 面临 的 选择 有 影响 的 模型 特征 可 能 的 值 
特征 来 刻画 用 户 ( 表 10. 2) 。 人 口 统计 信息 2, & 
开发 推荐 系统 时 ， 用 户 理解 的 基本 AAAH 是 ， 否 
维度 是 以 “人 为 中 心 ” 的 方式 [26]， 清 晰 “一 Be — v 
地 理解 与 尽 可 能 详尽 定义 用 户 应 用 ( 推 eee |R.* 
荐 系统 所 在 的 ) 交 互 系统 时 ， 其 使 用 环 。 _ 用 户 终端 条 件 限制 E, 否 
境 是 什么 ? 最 终 用 户 是 谁 ? 促使 用 户 使 《一 用 户 人 情境 重要 性 B. orb. f 
用 该 系统 的 推荐 服务 背后 的 用 户 期 望 和 A ALMAE 


目标 是 什么 ? 系统 应 用 的 核心 环境 因素 

是 什么 ? 在 全 面 回答 有 关 使 用 环境 的 问题 过 程 中 ， 有 关系 统 设计 和 技术 选择 的 基本 要 求 就 
会 被 揭示 出 来 。 

10. 3.2.1 理解 谁 是 用 户 


理解 谁 是 推荐 系统 的 用 户 需 要 仔细 项 酌 三 个 主要 方面 理解 识别 用 户 的 主要 特征 ， 用 
户 的 技能 水 平和 用 户 之 前 在 类 似 系 统 的 使 用 体验 。 我 们 强调 用 户 特 征 的 识别 ， 是 因为 其 在 
推荐 系统 设计 中 具有 独特 用 途 。 

识别 用 户 特征 : 在 推荐 系统 的 用 户 模型 开发 中 ， 首 要 起 点 是 为 不 同 的 用 户 群 画 像 ， 包 
括 采集 用 户 人 口 统计 学 信息 (如 年 龄 、 性 别 、 工 作 领 域 、 国 籍 、 语 言 ) 以 及 来 自用 户 调研 的 
深入 定性 信息 。 理 解 这 些 因 素 能 够 让 开发 团队 建立 用 户 之 间 的 联系 ， 以 及 鉴定 用 户 的 
需求 。 
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用 户 聚 类 能 够 : 1) 建 立 基于 人 口 统 计 信息 的 简单 推荐 系统 。 将 用 户 聚 类 为 不 同 群 组 的 
方法 通常 用 于 目标 广告 投放 解决 方案 L23]; 2) 定 义 一 个 用 户 原型 (stereotypes)[42]: 原型 
技术 使 用 一 系列 不 同 特征 定义 一 个 用 户 群 ， 当 系统 的 新 用 户 出 现时 ， 可 根据 新 用 户 的 个 人 
数据 ， 预 判 其 用 户 类 型 ， 推 荐 系统 按照 其 用 户 类 型 分 配给 他 一 系列 默认 的 偏好 值 ， 而 推荐 
系统 的 用 户 信息 更 新 机 制 将 依据 用 户 随后 产生 的 行为 对 其 用 户 信息 进行 修正 [17]。 基 于 用 
户 特征 的 个 性 化 解决 方案 可 与 更 复杂 的 技术 组 合 使 用 : 如 作为 混合 过 滤 程 序 中 的 初始 步 
又 ， 或 通过 原型 用 户 信息 来 引导 基于 内 容 的 过 滤 算 法 。 

此 外 ， 用 户 类 型 (如 专业 用 户 或 最 终 用 户 ) 是 判断 用 户 期 望 水 平等 方面 及 相应 算法 选择 
的 关键 指标 。 

10. 3.2.2 理解 用 户 动机 、 目 标 和 期 望 

目标 和 动机 : 推荐 系统 的 设计 者 需要 识别 用 户 任务 [25] 和 了 解 应 用 程序 能 否 完全 支 
持 。 例 如 ， 亚 马 逊 网 站 就 提供 用 户 可 能 购买 的 产品 并 且 推 荐 他 们 去 购买 。 从 用 户 的 观点 来 
看 ， 他 们 使 用 这 项 服务 的 初衷 无 非 有 两 种 情况 ， 要 么 为 自己 买 ， 要 么 为 他 人 买 。 然 而 亚 马 
了 还 的 推荐 系统 没有 区 分 这 两 个 目标 ， 因 而 导致 在 其 中 一 种 情况 下 提供 的 推荐 结果 不 够 准 
确 。 另 外 一 个 例子 ， 带 有 内 容 推 荐 系统 的 搜索 引擎 ， 能 够 提高 用 户 浏览 因特网 并 且 根 据 其 
搜索 请 求 发 现 信息 的 机 会 。 在 此 背景 下 用 户 的 动机 可 能 是 需要 完成 一 个 有 针对 性 的 目标 ， 
或 者 他 们 的 目的 仅仅 是 放松 、 花 时 间 浏 览 些 有 趣 的 事 。 识 别 和 理解 用 户 动机 可 以 使 推荐 效 
果 和 用 户 体验 得 到 提升 。 通 过 用 户 模 型 ( 表 10. 2) 来 深入 了 解 用 户 ， 可 以 让 设计 者 考虑 这 个 
应 用 将 来 需要 的 支持 可 能 的 任务 范围 。 

在 大 多 数 情况 下 ， 推 荐 系统 的 使 用 可 能 会 有 很 多 目的 ， 而 设计 者 必须 考虑 发 现 本 质 目 
标的 方法 ， 明 确 的 还 是 隐 含 的 。 一 个 明确 的 目标 可 能 被 一 个 应 用 定义 (如 亚马逊 可 以 添加 
一 个 按钮 来 询问 用 户 是 为 自己 还 是 为 他 人 购买 这 个 物品 ) 或 者 让 用 户 来 表达 (如 通过 一 系列 
的 问卷 ) 。 一 个 隐 含 的 目的 可 以 是 应 用 本 身 事先 定义 的 (例如 ， 在 个 性 化 的 新 闻 推 送 系 统 
中 ， 系 统 提供 新 闻 ， 认 为 用 户 想 要 得 到 更 多 世界 大 事 的 详细 信息 ?或 者 从 与 用 户 的 交互 中 
来 推断 。 相 反 ， 得 到 一 个 准确 的 任务 目标 可 能 不 太 容 易 ( 例 如 ， 应 用 可 能 被 兴趣 所 决定 )。 
在 这 种 情况 下 ， 建 立 一 个 好 的 推荐 系统 是 很 困难 的 ， 因 为 用 户 的 满意 度 和 外 界 的 因素 息 息 
相关 ， 如 不 受 系统 控制 的 用 户 心 情 。 在 这 种 情况 下 ， 多 样 性 、 数 量 和 精细 度 可 能 是 推荐 系 
统 最 重要 的 属性 。 

用 户 目标 对 于 在 展示 推荐 结果 时 的 过 滤 算 法 和 多 样 性 试探 L55，54] 非 常 重要 ， 如 果 在 
设计 阶段 没 能 很 好 地 解决 ， 就 会 产生 用 户 不 满 。 例 如 ， 基 于 内 容 的 模型 更 适应 集中 的 人 和 群 
(因为 集中 性 的 结果 ) ， 而 协作 模型 更 适合 那些 没有 集中 的 目标 的 人 群 ( 因 为 更 广泛 的 多 样 
性 的 结果 ) 。 

BAHRA.: 在 前 面 的 内 容 中 描述 的 用 户 显 性 或 者 隐 性 目标 是 评估 用 户 期 望 等 级 的 
关键 : 

。 高 期 望 值 可 以 被 理解 为 那些 目标 很 明确 的 、 专 注 于 完成 当前 任务 的 用 户 。 这 意味 

着 推荐 系统 必须 提供 高 质量 [25] 的 推荐 结果 才能 得 到 用 户 的 高 满意 度 。 这 种 水 平 
的 期 望 值 也 与 应 用 层 的 决策 有 关 ( 见 10. 3. 1 节 ) ， 推 荐 系统 在 整个 应 用 中 的 地 位 以 
及 目标 设备 的 约束 对 用 户 期 望都 是 极其 重要 的 。 回 到 新 闻 推 送 系统 的 这 个 例子 上 ， 
也 就 是 说 这 个 系统 必须 提供 全 部 是 好 的 项 目 列表 。 如 果 用 户 在 推荐 系统 给 出 的 前 
十 个 推荐 中 找 不 到 合适 的 个 性 化 新 闻 ， 最 好 的 可 能 是 他 们 开始 向 下 翻动 继续 寻找 ， 
最 坏 的 可 能 是 不 再 使 用 这 个 应 用 ， 因 为 他 们 在 第 一 次 使 用 时 就 觉得 不 满意 。 
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。 中 等 期 望 值 可 以 看 作 推荐 系统 推荐 一 些 好 的 物品 [25]。 如 果 用 户 有 选择 并 且 在 使 
用 推荐 系统 中 灵活 地 完成 了 任务 ， 那 他 们 的 期 望 值 会 相对 低 一 点 。 在 这 种 情况 下 ， 
我 们 也 会 发 现 ， 使 用 推荐 纯粹 是 评估 系统 给 予 的 推荐 结果 是 否 跟 他 们 的 期 望 一 致 。 
一 些 人 在 寻找 与 他 们 偏好 完全 一 致 的 推荐 ; 另 一 些 人 想 发 现 与 他 们 目前 习惯 不 一 
样 的 新 建议 。 
。 低 期 望 值 主要 是 针对 那些 被 用 在 一 个 随机 的 环境 中 的 个 性 化 的 应 用 。 正 如 [46j] 对 
网 站 推荐 系统 的 描述 中 所 说 :“ 研 究 表 明 ， 如 果 任 务 是 固定 的 ， 如 仅 是 随意 地 看 
看 ， 那 么 推荐 网 站 是 困难 的 。” 
每 一 个 不 同等 级 的 期 望 值 导 致 了 不 同 的 态度 ， 从 最 终 的 用 户 驱动 、 用 户 的 满意 程度 ， 
删除 应 用 到 使 用 推荐 系统 仅 是 为 了 娱乐 。 
处 理 随 着 时 间 改 变 的 期 望 值 ， 当 使 用 推荐 系统 的 时 候 ， 用 户 的 期 望 可 能 随 着 时 间 的 改 
变 而 改变 。 考 虑 是 否 需 要 建立 一 个 自动 适应 的 推荐 系统 是 相当 重要 的 。 大 部 分 的 推荐 系统 
已 经 包含 时 间 变 量 ; 随 着 得 到 用 户 信息 的 增长 能 够 得 到 更 准确 的 推荐 结果 。 第 一 次 使 用 推 
荐 系统 时 ， 用 户 在 一 开始 使 用 推荐 系统 时 对 推荐 系统 的 能 力也 抱 有 期 望 ， 随 着 时 间 的 增 
长 ， 他 们 对 推荐 系统 更 加 熟悉 ， 他 们 的 需求 也 发 生 了 变化 。 不 但 推荐 系统 能 够 随 着 时 间 的 
变化 来 满足 用 户 的 需求 是 非常 重要 的 ， 而 且 他 们 能 够 在 用 户 的 生命 周期 中 尽早 地 证 明 系 统 
的 性 能 来 满足 用 户 的 期 望 ， 建立 对 推荐 系统 输出 结果 的 信任 和 确保 继续 使 用 也 是 相当 重 
Xm. — 
10.3.2.3 理解 用 户 环境 


最 后 一 个 要 考虑 的 地 方 是 推荐 系统 使 用 中 的 环境 因素 : 

APRS: 首先 要 考虑 的 是 用 户 用 什么 设备 来 接 入 推荐 系统 ?现在 在 应 用 和 服务 器 上 
的 推荐 系统 有 了 新 的 特征 就 是 方便 接 人 ， 如 手机 、 电 脑 或 者 机 顶 盒 。 这 些 系统 设计 的 实现 
已 经 在 10. 3. 1 节 学 习 过 。 

交互 环境 ; 环境 的 考虑 首先 包括 位 置 ， 因 为 无 处 不 在 的 移动 设备 的 使 用 使 得 它 变 成 首 
先 要 考虑 的 问题 。 位 置 的 考虑 因素 可 能 包括 绝对 地 标 ， 例 如 ， 如 果 你 希望 在 移动 设备 上 推 
荐 本 地 的 名 胜 古 迹 ， 并 且 在 绝对 的 位 置 理解 用 户 的 行为 ， 如 了 解 用户 是 在 工作 还 是 在 购 
VI? 另 一 个 重要 的 环境 因素 要 考虑 的 是 时 间 因 素 。 给 用 户 建立 模型 的 时 候 ， 对 于 推荐 系统 
考虑 收集 带 有 时 间 信 息 的 用 户 属性 数据 集 是 重要 的 。 举 个 例子 ， 一 个 用 户 可 能 在 上 班 途中 
通过 移动 电视 看 新 闻 ， 但 他 更 喜欢 在 同一 趟 火车 的 下 班 路 上 看 喜剧 。 已 经 有 一 些 解决 方案 
在 推荐 系统 模型 中 应 该 考虑 这 些 因素 ; 例如 ， 兴 趣 和 给 定 的 环境 有 一 个 显 性 的 联系 [12]， 
或 者 属性 和 环境 之 间 的 联系 较为 隐 项 [29]。 结 合 位 置 和 时 间 的 数据 集 对 于 建立 更 加 健壮 的 
推荐 系统 具有 极 大 的 帮助 [4]。 

会 环境 : 这 里 有 一 个 要 考虑 的 重要 因素 是 推荐 系统 的 使 用 是 单个 人 还 是 和 其 他 人 一 
起 。 这 影响 许多 的 设计 决策 : 包括 算法 的 选择 、 数 据 收集 的 方法 和 推荐 结果 的 展现 。 举 例 
来 说 ， 这 些 问 题 可 以 有 助 于 决策 出 成 组 推荐 的 策略 (也 可 以 阅读 第 21 章 )， 例 如 ， 合 并 用 
户 单独 的 偏好 来 获得 一 个 群体 用 户 信息 ， 可 以 用 于 内 容 检索 进程 [6，10，20]， 或 者 为 了 
通过 用 户 合作 定义 一 个 共享 的 内 容 检 索 策略 [7，32] 或 者 其 他 描述 方法 的 一 致 性 原理 应 用 
[15]。 然 而 尽管 在 一 个 群体 中 ， 人 们 仍然 需要 独立 的 推荐 结果 ， 例 如 ;在 电视 节目 中 [8]。 
对 于 这 个 例子 ， 在 [11，30j 已 经 提 到 了 一 些 解 决 方案 。 

所 以 这 些 间 题 需 要 经 过 充分 的 考虑 ， 并 且 尽 可 能 地 做 大 量 的 用 户 研究 。 尽 管 这 看 起 来 
是 一 项 非常 大 的 动作 ,但 是 理解 这 些 领 域 中 哪些 是 与 推荐 系统 相关 的 ， 可 以 提炼 大 量 的 研 


10.3.3 数据 模型 
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设计 者 应 该 仔细 研究 的 最 后 一 点 是 推荐 系统 将 要 利用 和 管理 的 物品 特性 。 事 实 上 ， 对 


物品 的 描述 比 个 性 化 推荐 系统 存在 要 早 ， 并 
— 且 推 荐 系统 的 设计 者 也 不 太 可 能 影响 或 者 改 
变 它们 。 我 们 提出 了 一 个 数据 模型 用 于 定义 


表 10.3 数据 模型 


模型 的 特征 


可 能 的 值 


那些 会 对 系统 设计 和 将 来 的 推荐 结果 有 影响 SEAS eee 
的 主要 数据 特征 。 设 计 者 应 该 遵循 我 们 的 数 c LT 二 
据 模 型 ， 比 如 ， 对 于 数据 模型 中 的 每 一 个 特 - 
机 fü x 
征 ， 都 应 该 考虑 其 在 表 10. 3 中 可 能 的 值 。 noo Aa 
10.3.3.1 理解 可 以 用 来 描述 物品 的 数据 类 型 ”物品 的 种 类 同类 、 异 类 
这 里 存在 以 下 几 种 方式 来 描述 物品 : BEMAN KR. XH 
。 无 结构 化 数据 : 物品 只 能 用 无 结构 ”物品 的 稳定 性 和 持久 性 稳定 的 、 变 化 的 、 易 变 的 
化 的 数据 来 表示 。 无 结构 化 数据 指 。 用 户 评分 隐 性 的 、 显 性 的 、 Xx 
评分 类 型 二 进 制 、 多 等 级 …… 


的 是 那些 既 没 有 一 个 数据 模型 ， 也 
不 能 很 容易 地 被 计算 机 程序 使 用 (如 


视频 、 音 频 、 无 结构 文本 ) 的 数据 。 在 这 些 情况 下 ， 需 要 通过 预 处 理 来 提取 标志 性 
的 关键 词 或 概念 以 帮助 区 分 不 同 的 物品 。 事 实 上 ， 无 结构 化 数据 并 不 是 阻塞 所 在 ， 
因为 在 大 多 数 情况 下 ， 有 许多 的 技术 用 来 获取 描述 物品 的 元 数据 集 。 在 文本 分 析 
H, & GATE[19] 或 Lucene® 等 工具 能 够 从 无 结构 化 的 文本 中 提取 关键 词 。 虽 然 
从 其 他 类 型 的 数据 如 多 媒体 内 容 ( 图 像 、 视 频 ) 中 提取 元 数据 的 技术 缺乏 可 靠 性 ， 
但 还 是 经 常 需要 将 它们 结合 在 一 起 。 

半 结 构 化 数据 : 一 个 物品 经 常用 好 几 类 元 数据 描述 ， 对 应 的 主要 物品 特征 项 和 自 
由 文本 。 半 结构 化 数据 的 典型 案例 是 亚马逊 ?的 产品 页 或 者 被 很 多 属性 (节目 类 型 、 
节目 时 间 表 等 ) 所 表示 的 电视 节目 。 每 个 属性 取 值 在 一 组 有 限 的 词汇 (这 属于 一 个 
分 类 或 本 体 )， 或 者 包括 无 结构 元 素 ( 如 节目 的 大 纲 )。 在 这 种 情况 下 ， 数 据 数量 和 
质量 的 评估 需要 知道 物品 的 元 数据 是 否 应 该 在 非 结构 化 部 分 通过 执行 一 些 处 理 和 
分 析 来 提升 。 

结构 化 数据 : 物品 也 可 以 用 结构 化 的 模型 所 描述 。 这 可 能 是 一 个 标准 或 者 一 个 事 
实 上 的 标准 ， 例 如 ，TVAnytime 用 电子 节目 指南 (EPG) 来 为 DVB-H 描述 电视 
节目 。 当 有 结构 化 数据 的 时 候 ， 设 计 者 必须 检查 数据 的 数量 和 质量 来 预计 在 一 个 
个 性 化 系统 框架 信息 中 缺失 的 可 能 性 。 


这 个 基本 的 数据 特征 有 许多 影响 。 首 先 ， 在 算法 方面 : 如 果 数 据 是 无 结构 化 的 ， 那 么 
提取 相关 元 数据 的 开销 会 很 大 ， 效 果 也 不 太 准 确 。 下 面 的 全 部 推荐 算法 系列 应 该 排除 : 基 
于 内 容 的 推荐 系统 算法 [51]( 第 3 章 ) ， 贝 叶 斯 模型 [21]， 基 于 规则 的 系统 和 度量 距离 。 只 
有 协同 过 滤 模 型 (第 4 章 ) 能 够 用 在 这 样 环 境 中 。 第 二 ， 在 用 户 建 模 方面 : 用 户 模型 中 应 该 


© Lucene, 一 个 开源 的 信息 检索 库 ，http://lucene. apache. org/ 


© Amazon, http://www. amazon. com 
© TV Anytime, http://www. tv-anytime. org/ 
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反映 数据 表示 方法 ， 例 如 ， 如 果 一 段 文本 表示 为 一 个 关键 词 向 量 ， 那 么 基于 方法 的 内 容 将 
使 用 关键 词 向 量 来 表示 用 户 信 息 。 在 无 结构 化 数据 情况 下 ， 用 户 模型 可 以 非常 简单 ， 如 用 
户 的 消费 历史 。 
10.3.3.2 理解 元 数据 的 质量 ABC Aik 

结构 化 数据 的 质量 和 数 荆 对 于 推荐 系统 是 一 个 重要 的 性 能 因素 ， 尤 其 是 在 使 用 基于 内 
容 的 推荐 系统 时 。 元 数据 的 某 些 属性 在 关于 个 性 化 系统 设计 的 选择 中 扮演 着 非常 重要 的 
角色 。 

质量 : 设计 者 需要 对 可 利用 的 元 数据 的 质量 有 一 些 掌 握 ， 了 解 做 决策 时 要 考虑 的 元 数 
据 的 质量 是 中 等 的 还 是 低 等 的 。 通 常情 况 下 ， 如 果 一 个 物品 的 元 数据 描述 能 够 将 这 个 物品 
与 其 他 物品 区 别 开 ， 则 认为 物品 的 元 数据 描述 是 高 质量 的 。 例 如 ， 在 新 闻 RSS 提要 中 ， 
两 个 物品 能 分 享 共同 的 关键 词 ， 相 当 于 新 闻 的 一 类 (如 运动 新 闻 、 足 球 )， 但 是 这 必须 有 足 
够 的 其 他 关键 词 来 将 新 闻 区 分 为 是 一 些 比赛 相关 的 ， 是 全 球 性 的 竞赛 事件 相关 的 ， 还 是 一 
名 足球 运动 员 相 关 的 等 。 在 这 个 示例 中 ， 设 计 者 必须 理解 在 描述 中 细节 的 正确 等 级 来 获得 
推送 新 闻 之 间 的 不 同 。 在 我 们 模型 中 ， 对 于 推荐 系统 的 设计 者 而 言 ， 元 数据 的 质量 特征 是 
决策 的 一 个 主要 点 。 设 计 者 不 得 不 在 推荐 结果 的 准确 度 与 推荐 系统 响应 时 间 、 存 储 能 力 和 
进程 开销 之 间 进 行 权衡 。 例 如 ， 如 果 设 计 者 想 要 一 个 最 佳 的 性 能 ， 他 将 在 架构 上 引入 一 些 
限制 ， 避 免 在 轻 基 级 客户 机 上 运行 。 设 计 者 也 可 以 选择 用 两 阶段 式 的 算法 运作 推荐 系统 ， 
分 布 在 服务 器 和 客户 端 设备 之 间 [37]。 质 量 特 征 也 和 推荐 系统 在 应 用 中 所 扮演 的 角色 以 及 
用 户 对 于 这 个 角色 (请 看 10.3.1 节 和 10. 3. 2 节 ) 的 期 望 有 关 。 

表现 力 : 未 来 的 用 户 也 是 评估 元 数据 进程 的 基础 。 元 数据 必须 能 够 反映 用 户 对 物品 的 
观点 ， 并 且 表 达 出 用 户 对 物品 不 同 特性 的 想法 。 所 以 元 数据 的 表现 力 对 推荐 系统 的 性 能 是 
至 关 重 要 。 物 品 可 以 用 大 量 的 语义 表示 : 从 没有 语义 使 用 标签 /关键 词 ， 如 Flickr? 上 图 片 
的 注释 ， 到 更 为 高 级 的 知识 表示 ， 如 分 类 或 者 本 体 论 ( 如 OpenCalais 中 的 文本 分 类 ) 。 作 
为 一 个 经 典 案例 ， 比 较 基 于 关键 词 的 方法 和 语义 方法 ， 一 个 物品 被 一 些 特殊 的 关键 词 ( 如 
足球 、 排 球 、 篮 球 等 ) 引 用 ， 那 么 这 个 物品 不 会 被 推荐 给 对 更 高 层次 (如 团体 运动 ) 感 兴趣 
的 用 户 。 通 过 语义 表示 ， 像 足球 、 排 球 、 篮 球 隐 含 知识 表示 为 团队 运动 ， 可 以 被 用 来 提取 
用 户 潜 在 的 偏好 和 推荐 结果 ， 因 为 这 些 运动 之 间 的 语义 关联 性 ， 所 有 团队 运动 相关 的 内 容 
都 会 被 推荐 。 通 过 用 语义 概念 来 描述 的 元 数据 能 够 用 于 更 为 复杂 的 推荐 算法 ， 如 文献 
[47]， 还 要 根据 位 置 考虑 在 同一 层次 的 相关 类 似 物 品 的 存在 ;或 者 文献 [48] 所 描述 的 延伸 
语义 选择 。 对 于 协同 过 滤 技 术 ， 在 算法 流程 中 考虑 语义 的 相似 性 ， 已 经 证 明 可 以 提高 准确 
度 ， 能 够 帮助 减少 稀疏 度 的 问题 [35]。 然 而 ， 这 里 也 有 些 实际 性 的 因素 要 考 虚 ; 例如 ， 语 
义 的 推测 引入 了 一 些 处 理 开 销 ， 可 能 不 太 适 合 小 型 设备 。 另 外 ， 如 果 元 数据 没有 被 语义 很 充 
分 地 描述 ， 一 些 算法 能 够 提高 元 数据 的 表达 水 平 ， 例 如 ， 通 过 维基 百科 [18 了 将 本 体内 容 与 
社会 化 标签 相 匹配 ， 或 者 创建 大 众 分 类 ( 相 比 较 第 19 章 )。 

WB: 元 数据 的 数量 是 要 考虑 的 一 个 很 重要 的 因素 太 少 的 元 数据 可 能 导致 推荐 结果 
的 不 准确 ， 而 太 多 的 元 数据 将 导致 无 用 的 处 理 。 另 外 ， 元 数据 对 物品 深度 (精确 度 ) 和 宽度 
(不 同 的 描述 ) 的 描述 可 能 会 变化 。 这 样 描述 的 风险 是 推荐 的 物品 可 能 与 用 户 的 期 望 并 不 一 


© Flickr, http://www. flickr. com 
© OpenCalais, http; //opencalais. com 
© Wikipedia, http://www. wikipedia. org 
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致 。 例 如 ， 如 果 一 个 用 户 对 有 关 自 然 灾 难 的 新 闻 感 兴趣 : 对 于 深入 的 描述 内 容 ， 用 户 将 得 
到 的 推荐 结果 是 关于 不 同 种 类 型 的 灾难 ; 对 于 广度 的 描述 内 容 ， 他 将 得 到 对 于 灾难 不 同 的 
观点 (政客 、 政 治学 家 、 经 济 学 家 等 )。 深 层次 的 描述 可 能 会 加 强 基于 内 容 的 过 滤 算 法 的 某 
些 缺 点 ， 事 实 上 也 过 于 专业 化 。 用 户 想 要 的 深度 和 广度 的 层次 可 以 通过 系统 来 学 习 。 
基于 标准 的 描述 : 不 考虑 元 数据 的 表现 力 级 别 ， 元 数据 可 以 用 不 同 的 方式 来 描述 : 使 
用 标准 ， 如 Dublin CoreS ，MPEG-7® 、IPYCe ;或 者 使 用 专 有 格式 。 如 果 元 数据 的 表示 
不 受 个 性 化 应 用 的 设计 者 左右 ， 那 么 可 以 用 某 些 要 素来 指导 选择 元 数据 的 不 同形 式 ， 如 推 
荐 系统 与 应 用 中 的 其 他 部 分 的 整合 程度 (如 使 用 一 个 检索 引擎 ) 。 
10.3.3.3 理解 物品 集 的 属性 


物品 的 数量 : 除了 每 个 物品 元 数据 的 数量 ， 我 们 也 应 该 考虑 数据 集中 物品 的 数量 。 它 
是 决定 选择 推荐 系统 家 族 的 重要 因素 。 实 际 上 ， 协 同 过 滤 算 法 需要 大 量 的 数据 集 或 者 用 户 
集 来 计算 相关 有 效 性 。 这 特别 适合 书籍 、 电 影 等 的 推荐 ， 而 基于 内 容 的 小 型 数据 集 也 可 以 
处 理 ( 如 电视 节目 ) 。 

物品 的 分 布 : 数据 集中 的 物品 分 布 情 况 也 是 一 个 必须 考虑 的 因素 。 例 如 ， 在 一 个 电影 
数据 集 ， 如 果 有 很 大 比例 的 电影 被 标注 有 “动作 片 ”的 注释 ， 这 种 元 数据 可 能 描述 得 不 充分 
《如 果 他 喜欢 动作 电影 ， 那 么 有 太 多 的 电影 要 选 ， 如 果 不 喜 欢 ， 就 基本 上 没什么 可 选 的 
了 )。 在 这 种 情况 下 ， 需 要 重新 考虑 数据 注释 的 深度 层次 以 便 获得 更 高 质量 的 元 数据 。 

物品 的 本 质 和 物品 集 的 稳定 性 : 新 的 物品 ， 图 书 ， 或 者 电视 节目 有 本 质 上 的 不 同 ， 因 此 
依据 物品 属性 的 不 同 用 户 行为 也 不 一 样 。 例 如 ， 很 容易 理解 对 于 电视 节目 和 图 书 的 兴趣 比 对 
于 新 闻 的 兴趣 更 加 稳固 ， 因 为 新 闻 变 化 得 更 频繁 ， 并 且 有 更 多 不 同 的 主题 出 现 。 所 以 ， 这 项 
准则 影响 是 否 要 用 可 适应 型 推荐 系统 (例如 ， 用 户 信息 随 着 时 间 而 改变 )， 重 点 是 需要 了 解 不 
同 的 发 展 模式 ， 如 稳固 的 兴趣 、 发 展 的 兴趣 、 快 速 变化 的 兴趣 等 [38，39]。 我 们 也 应 该 考虑 
物品 集 的 稳定 性 ， 例 如 ， 引 入 新 物品 或 者 物品 消失 的 频率 。 另 外 ， 一 个 推荐 系统 可 以 在 同 构 
数据 下 工作 (如 MovieLens)， 或 者 也 可 以 用 异 构 数据 (就 像 亚 马 逊 那样 做 的 )。 为 了 给 物品 推 
荐 系统 选择 一 个 适合 的 策略 ， 研 究 物品 之 间 的 相关 性 是 很 重要 的 ， 例如， 如 何在 书籍 的 品味 
中 反映 对 于 某 种 音乐 类 型 的 兴趣 。 这 样 的 分 析 能 够 帮助 选择 推荐 系统 的 策略 ， 如 综合 考虑 所 
有 的 物品 ， 或 者 用 基于 每 一 个 物品 类 型 的 特性 应 用 特定 的 准则 来 替代 。 

用 户 物 品评 分 : 另 一 个 要 重点 考虑 的 是 用 户 是 否 有 评分 。 如 果 在 系统 中 用 户 没有 对 相 
关 物 品 进行 评分 ， 这 就 排除 了 整个 协同 过 滤 模 型 家 族 了 。 用 户 对 物品 的 评分 既 可 以 很 显 式 
的 (例如 ， 在 亚马逊 ， 用 户 可 以 指出 他 们 对 一 本 书 或 者 一 盘 CD 的 喜欢 程度 )， 也 可 以 用 其 
他 的 表示 准则 (如 二 进 制 、 多 级 等 ) 。 如 果 这 不 能 被 直接 地 应 用 ， 但 也 认为 在 个 性 化 应 用 是 
有 用 的 ， 它 可 以 被 用 来 计算 隐 式 反馈 指标 [41]( 例 如 ， 购 买 物品 这 一 事实 可 以 被 认为 是 用 
户 兴趣 的 隐 式 指示 )， 这 个 也 可 以 用 在 一 些 推荐 算法 (如 协同 过 滤 算 法 )， 或 者 作为 用 户 信 
息 适 应 模块 的 一 个 输入 ， 即 根据 用 户 对 特定 物品 是 喜欢 还 是 不 喜欢 来 更 新 用 户 的 兴趣 。 


10.3.4 一 个 使 用 环境 模型 的 方法 
在 表 10. 1、 表 10.2 和 表 10. 3 中 ， 我 们 引入 三 个 模型 来 帮助 理解 将 来 推荐 系统 的 环 


都 柏林 核心 元 数据 倡议 ，http://dublincore. org/ 
MPEG-7 概览 ，http://www. chiariglione. org/mpeg/standards/mpeg-7 
际 新 闻 电 讯 委 员 会 ，IPTC(International Press Telecommunications Council), http: //iptc. org 
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境 。 对 于 每 个 模型 和 每 个 特征 ， 我 们 提出 了 一 些 指导 方针 来 定义 将 来 推荐 系统 的 需求 和 约 
束 。 为 了 充分 理解 这 些 特征 的 重要 性 ， 我 们 分 两 步 提 出 一 个 模型 。 
。 确定 不 同 特征 之 间 的 依赖 关系 : 设计 者 必须 建立 一 个 贯穿 三 个 模型 的 依赖 图 来 找 
到 哪些 特征 会 影响 其 他 的 特征 。 这 个 图 将 帮助 设计 者 理解 一 个 特征 的 变化 是 如 何 
影响 整个 推荐 系统 环境 的 。 例 如 ， 改 变 整 个 推荐 系统 的 导航 功能 (应 用 模型 ) 将 改 
变 用 户 期 望 ( 用 户 模 型 )。 ' 

。 确定 模型 的 关键 特征 : 关键 特征 是 指 那些 对 推荐 结果 的 选择 、 自 适应 算法 ， 以 及 
推荐 系统 架构 有 重要 影响 的 特征 。 例 如 ， 正 确 性 (应 用 模型 ) 对 推荐 结果 的 选择 有 很 重大 的 
影响 。 这 些 关 键 特征 的 确定 有 助 于 准备 评估 框架 的 工作 和 如 何 解释 评估 结果 。 

在 10.5 节 会 给 出 一 个 例子 ， 作 为 这 个 方法 的 例证 。 

然而 ， 在 这 一 节 中 ， 我 们 已 经 确定 了 所 有 在 设计 推荐 系统 时 要 研究 的 要 素 。 基 于 第 一 
步 ， 设 计 者 应 该 能 够 为 过 滤 物 品 选择 合适 的 算法 ， 为 用 户 信息 做 调整 (如 果 有 必要 )， 以 及 
选择 正确 的 系统 架构 。 下 一 个 阶段 设计 者 要 考虑 如 何 实现 他 的 推荐 系统 ( 见 参考 文献 部 
分 )， 然 后 评估 算法 ， 正 如 在 10.4 节 中 所 阐释 的 。 


10.4 在 和 迭代 设计 过 程 中 理解 推荐 验证 步骤 


尽管 提出 的 模型 能 够 对 推荐 系统 的 关键 部 件 做 出 精明 的 决策 ， 但 是 在 使 用 之 前 ， 还 需 
要 通过 实验 测试 及 必要 的 迭代 设计 ， 对 许多 参数 进行 调整 。 以 下 两 个 方面 必须 注意 : 算法 
的 自我 验证 和 推荐 结果 验证 ， 这 个 过 程 必须 让 用 户 参 与 。 


10. 4. 1 算法 的 验证 


许多 实验 性 论文 已 经 证 明 针 对 现 有 数据 集 推荐 方法 的 测试 是 有 用 的 ， 例如，Mov- 
ieLens 和 Netflix® 数 据 集 等 。 从 这 些 实验 中 ， 这 些 数 据 集 被 用 来 理解 算法 的 运行 状况 ; 有 
时 候 ， 为 了 能 够 使 用 这 些 数据 集 ， 需 要 把 它们 进行 转换 和 填充 (例如 ， 使 用 IMDBS 数 据 填 
充 MovieLens 数据 )。 在 许多 文献 中 已 经 对 这 些 实验 数据 进行 了 深入 的 研究 。 例 如 ， 在 文 
献 [25J 中 ， 详 细 列 出 了 一 些 可 计算 指标 。 此 外 ， 这 些 指 标 支 持 基 于 数据 特征 和 有 用 信息 其 
他 方法 的 客观 比较 ， 并 且 当 需要 大 规模 的 用 户 时 ， 这 可 能 特别 有 用 。 这 样 的 评价 指标 也 可 
以 针对 算法 中 个 性 化 参数 进行 修正 ， 例 如 ， 距 离 度 量 可 以 用 来 计算 一 个 用 户 与 相关 项 目 内 
容 之 间 的 相似 度 。 这 些 方法 在 许多 文献 中 被 广泛 提 及 ， 因 此 在 这 里 就 不 再 详 述 。 具 体 细节 
可 以 参考 第 8 章 的 内 容 。 

在 可 用 数据 集 上 测试 算法 的 详细 过 程 中 ， 由 10. 3.4 节 中 描述 的 方法 确定 特征 关联 和 
影响 图 ， 必 须 帮助 设计 者 能 够 发 现 数据 集 是 否 正在 改变 相对 于 目标 系统 的 推荐 环境 (数据 、 
用 户 和 应 用 )。 这 个 图 必须 能 够 帮助 解释 说 明 算法 的 结果 ， 并 且 决 定 算法 修正 的 范围 及 测 
试 的 走向 。 如 果 环 境 特 征 确实 能 够 接近 一 个 目标 系统 ， 那 么 可 能 值得 尽量 调整 算法 。 但 
是 ， 如 果实 验 环境 与 目标 环境 分 析 结 果 存 在 显著 的 差异 ， 那 么 这 个 实验 过 程 可 以 尽快 结 
束 ， 并 把 注意 力 放 在 故障 的 排查 上 ， 而 不 要 放 在 小 幅度 地 提高 推荐 的 精确 度 上 。 许 多 的 研 
究 都 关注 提高 算法 的 精确 度 [33]， 但 即使 一 个 推荐 算法 能 够 提供 准确 的 推荐 结果 ， 也 仍 需 
要 考虑 数据 实例 、 用 户 模 型 及 其 与 数据 集 的 关联 性 。 因 此 ， 理 解 环境 模型 特征 的 重要 性 及 
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其 相互 关联 性 对 评价 结果 的 正确 解释 要 比 一 个 标准 的 数据 集 更 重要 。 例 如 ， 当 我 们 把 电视 
数据 转换 成 新 闻 数 据 时 ， 用 户 的 行为 是 不 一 样 的 ， 并 且 数 据 也 不 具有 相同 的 动力 学 特性 
(具体 见 10.5 节 )。 在 这 个 例子 中 ， 在 调整 算法 提高 其 在 电视 数据 集 上 的 准确 率 中 花费 大 
量 的 时 间 完 全 就 是 浪费 。 


10.4.2 ”推荐 结果 的 验证 


有 许多 技术 措施 能 够 在 理论 上 提高 推荐 的 准确 度 。 为 了 改善 性 能 和 提高 用 户 满意 率 ， 
对 性 能 和 满意 率 的 保障 措施 严峻 考验 在 于 ， 能 否 切实 体现 在 所 有 领域 推荐 系统 的 评估 结 
果 上 。 

评估 任何 交互 系统 的 关键 在 于 服从 一 个 以 用 户 为 中 心 的 方法 。 也 就 是 基于 变化 和 改进 
进行 尽早 的 、 反 复 的 、 频 繁 的 评估 。 这 带 来 一 些 挑战 。 事实 上 ， 正 如 前 面 所 讨论 的 ， 推 荐 
系统 很 少 是 开发 活动 的 中 心 ， 而 是 一 个 更 大 的 产品 或 者 系统 集成 的 子 功能 。 常 见 的 情境 是 
开发 更 大 的 主机 系统 在 不 同 开发 时 段 运行 推荐 引擎 。 这 种 情况 使 得 对 于 潜在 推荐 技术 的 评 
估 ， 没 有 方法 收集 建立 用 户 信 息 或 者 向 用 户 呈 现 推荐 方法 的 用 户 偏 好 。 

这 些 因素 往往 会 导致 面向 用 户 交互 的 推荐 (数据 收集 和 推荐 结果 展现 ) 评 价 与 底层 引擎 
分 离 ， 除 非 这 两 个 过 程 能 够 实现 原型 集成 。 从 评估 的 角度 来 说 ， 这 是 有 意义 的 。 例 如 , BBC 
够 防止 研究 成 果 与 其 他 领域 具有 竞争 性 的 积极 或 者 消极 设计 产生 相 混淆 。 

在 用 户 评价 工具 包 中 有 许多 技术 可 以 用 来 研究 推荐 系统 的 发 展 状况 。 下 面 将 介绍 一 些 
有 用 的 可 选择 方法 及 其 最 好 应 用 时 机 和 上 下 文 背景 。 所 有 这 些 方法 都 已 经 被 应 用 到 实际 项 
目 中 ， 并 且 在 推荐 系统 领域 中 基于 我 们 指导 用 户 的 研究 经 验 。 
10.4.2.1 卡片 分 类 法 

卡片 分 类 法 不 是 一 种 严格 意义 上 的 评估 方法 ， 但 是 在 实际 中 是 一 种 有 用 的 形式 设计 
研究 工具 。 它 可 以 用 于 根据 用 户 与 内 容 或 者 概念 关系 模型 对 项 目 进行 分 类 。 此 方法 基本 
是 要 求 用 户 依 据 相 似 度 对 一 组 卡片 进行 分 类 ， 并 描述 项 目 内 容 或 者 子 类 [44]。 为 了 能 够 
在 分 类 用 户 发 现 共 享 模型 并 建立 树 型 关系 ， 可 以 利用 聚 类 发 现 产 生 一 组 用 户 的 结果 排序 
分 组 。 可 以 使 用 像 IBM 的 EZsort 这 样 的 软件 工具 来 大 幅度 地 降低 此 分 析 过 程 的 时 间 和 
复杂 度 [20]。 . 

当 我 们 对 应 用 于 电视 类 型 分 类 的 距离 函数 进行 研究 时 ， 就 已 经 用 到 了 此 方法 。 尽 管 此 
领域 中 存在 多 种 元 数据 结构 ， 如 果 测 试 不 能 与 用 户 对 任 一 类 别 间 相 似 度 的 理解 相 结 合 ， 那 
么 这 种 测试 是 相当 困难 的 。 例 如 ， 研 究 结 果 表 明 由 于 用 户 要 表示 更 轻松 的 表演 这 个 概念 ， 
常常 把 一 些 不 同类 别 的 物品 分 类 在 一 起 。 这 些 类 别 包 括 娱 乐 节目 、 喜 剧 和 肥皂 剧 。 相 反 ， 
还 会 把 如 新 闻 和 记录 等 真实 内 容 的 类 别 分 成 不 同 的 类 别 。 此 信息 将 被 集成 到 算法 的 开发 过 
程 中 用 来 提高 推荐 的 准确 率 。 

开展 这 项 工作 的 价值 在 于 内 容 物品 相似 度 的 度量 基于 真实 用 户 的 分 类 方法 ， 而 不 是 基 
于 程序 员 或 者 工程 师 创建 的 智能 结构 。 此 方法 还 挖掘 出 不 同类 别 间 的 主观 相对 距离 。 从 用 
户 的 角度 来 讲 ， 这 两 个 因素 可 以 提高 推荐 结果 被 认为 是 相关 的 和 准确 的 。 由 于 这 种 方法 有 
益 于 底层 算法 的 构建 ， 因 此 这 个 工具 最 好 在 开发 形成 过 程 中 使 用 。 


10.4.2.2 ” 低 保 真 原型 


低 保 真 原型 是 指 包 括 与 用 户 探 究 交互 式 设计 理念 在 内 的 一 系列 方法 的 涵盖 性 术语 。 通 
常 这 种 方法 采用 纸 上 的 原型 来 评估 如 何 给 出 推荐 结果 的 设计 理念 ， 以 及 在 推荐 系统 开发 的 
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早期 如 何 获取 并 管理 用 户 信息 。 这 种 方法 的 优点 在 于 可 以 使 得 评价 在 早期 得 以 实现 ， 不 需 
要 在 开发 过 程 中 耗费 太 多 的 时 间 和 代价 。 但 是 此 方法 在 评价 实际 推荐 引擎 方面 没有 任何 价 
值 。 此 方法 把 原型 作为 一 种 虚拟 提示 ， 以 一 种 半 结 构 化 的 方式 运行 。 在 文献 L[50] 中 介绍 了 
此 方法 及 一 些 有 效 实例 。 使 用 低 保 真 原型 关键 在 于 他 们 不 应 该 看 起 来 像 成 品 设计 ， 因 为 这 
在 讨论 设计 思路 时 会 限制 用 户 的 作用 。 简 单 示 意图 和 轮廓 可 以 使 用 户 专注 于 有 意义 的 方法 
改进 和 精确 的 设计 思路 。 此 方法 是 从 用 户 的 角度 试图 收集 丰富 的 数据 信息 ， 因 此 从 本 质 上 
讲 它 是 定性 方法 。 利 用 一 个 确定 的 用 户 群 体 中 的 三 四 个 用 户 评估 一 个 设计 往往 会 在 积极 的 
方面 提供 足够 的 洞察 力 来 显著 地 影响 设计 。 

我 们 已 经 利用 这 种 结合 用 户 的 研究 方法 去 评估 了 实际 的 概念 设计 和 一 般 的 规则 设计 。 
例如 ， 为 了 收集 用 于 构建 用 户 模 型 的 反馈 信息 ， 我 们 利用 这 种 方法 说 明了 设计 评分 尺度 的 
可 能 思路 。 简 单 的 线条 图 足以 让 用 户 分 辨 各 个 概念 之 间 的 差异 ， 并 对 每 一 个 的 优点 和 缺点 
有 很 好 的 认识 。 这 让 用 户 可 以 对 为 推荐 系统 提供 的 显 式 反馈 的 概念 有 更 加 普遍 的 思考 ， 并 
知道 这 在 结果 和 隐私 方面 意味 着 什么 。 
10. 4.2.3 主观 定性 评估 


此 方法 是 从 目标 用 户 的 角度 评估 推荐 引擎 的 准确 率 和 满意 率 水 平 。 它 的 主要 优点 在 于 
多 功能 性 : 它 是 一 种 定性 的 方法 ， 即 使 在 支持 数据 集 和 推荐 结果 展示 部 件 还 不 存在 的 情况 
下 ， 也 能 够 为 一 个 系统 立刻 输出 推荐 结果 。 它 同样 可 以 用 于 评估 充分 完全 实现 了 的 系统 。 
这 个 方法 是 基于 主观 评价 的 ， 应 用 此 方法 的 一 种 有 效 方式 是 通过 主持 管理 或 者 参与 完成 标 
准 的 调查 问卷 8 。 在 问卷 调查 中 为 用 户 生成 的 每 一 项 推荐 ， 并 根据 用 户 对 推荐 的 意见 提出 
一 些 问题 。 此 方法 包括 三 个 步骤 。 

1) 用 户 数据 的 收集 ， 建 立 用 户 信息 : 收集 一 定数 量 的 数据 是 推荐 系统 一 个 基本 性 能 特 
(E. 然而， 在 从 不 同 的 数量 的 信息 中 建立 参与 样本 是 明智 的 ， 这 种 信息 在 给 定 的 时 间 点 被 
获取 来 代表 不 同类 型 的 用 例 模式 ， 例如， 两 周 之 后 。 这 需要 分 析 有 关 用 户 感 知 的 准确 率 和 
满意 率 的 推荐 学 习 曲 线 的 效果 。 从 用 户 那里 轻松 地 数据 收集 过 程 同 样 也 是 一 个 完善 的 推荐 
系统 的 基本 功能 。 如 果 系 统 在 设计 阶段 的 数据 收集 功能 就 是 可 用 的 ， 那 么 在 研究 过 程 中 就 
可 以 考虑 利用 它们 。 由 于 利用 其 他 方法 很 难 把 此 类 数据 从 用 户 那里 直接 提取 出 来 ， 所 以 在 
系统 中 只 能 收集 隐 式 应 用 数据 。 显 然 ， 问 题 的 关键 在 于 开发 团队 能 够 接触 到 实际 用 户 。 因 
此 从 直接 评估 的 角度 来 讲 ， 最 初 收集 的 用 户 数 据 ( 例 如 ，web 分 析 形 式 ) 是 没有 用 的 。 从 零 
开始 收集 隐 式 数据 需要 参与 者 的 长 期 监督 实验 。 这 就 要 求 使 用 像 视频 观察 或 者 远程 使 用 跟 
踪 这 样 的 技术 ， 从 中 提取 准确 的 偏好 数据 。 这 是 一 个 费力 的 研究 活动 ， 而 且 也 会 提供 获取 
真实 用 户 观 察 的 额外 收益 以 及 新 颖 的 使 用 案例 ， 这 反 过 来 会 驱动 创新 。 相 比 之 下 ， 显 式 数 
据 收 集 在 没有 工作 系统 条 件 下 也 可 以 较 容易 地 仿真 出 来 。 通 过 电子 或 纸 质 的 调查 表 ， 收 集 
反馈 信息 是 一 种 有 效 方法 。 电 子 制 表 软 件 是 应 用 中 的 一 个 简单 实例 。 用 户 被 要 求 为 成 品系 
统 中 的 四 十 条 内 容 进 行 显 式 评分 。 通 过 互联 网 远程 招募 50 个 参与 者 ， 并 用 E-mail 发 送 调 
查 。 用 户 填 写 他 们 的 回答 ， 并 将 其 返回 给 设计 团队 。 

2) 产 生 推 荐 从 参与 者 返回 的 调查 问卷 中 提取 用 户 偏 好 数据 ， 并 将 其 编码 输入 推荐 
引擎 中 。 提 供 个 性 化 的 推荐 结果 的 一 个 重要 考虑 因素 是 跟踪 整个 研究 过 程 中 用 户 拥有 的 
数据 和 他 们 的 反馈 回应 。 首 先 ， 在 研究 过 程 中 需要 获取 保留 用 户 信息 的 许可 认证 。 给 每 


日 ” 间 卷 调查 开发 是 一 门 科 学 ， 所 以 如 果 你 不 是 很 熟悉 问卷 调查 设计 和 意见 评价 的 技巧 文献 [36] 是 二 份 很 好 
的 实际 参考 。 
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个 参与 者 一 个 ID,， 在 这 个 评估 过 程 中 利用 每 一 个 文件 中 的 数据 。 在 研究 过 程 中 ， 安 全 
保存 参与 者 的 所 有 具体 信息 ， 以 防 泄露 参与 者 的 ID 信息 。 最 后 ， 在 研究 结束 后 ， 要 确 
保 销 毁 参 与 者 的 个 人 敏感 信息 ， 并 将 对 研究 结果 进行 匿名 处 理 。 在 这 个 简单 过 程 中 保护 
用 户 隐私 。 

3) 推 荐 结果 展现 : 一 旦 为 每 一 个 用 户 都 产生 推荐 ， 那么 这 些 推荐 结果 需要 返还 给 参与 
者 进行 评估 。 在 调查 问卷 过 程 中 需要 参与 者 回答 的 问题 取决 于 推荐 系统 的 目标 。 关 于 推荐 
结果 ， 用 户 有 如 下 三 个 普遍 的 兴趣 点 : 

。 推荐 结果 是 否 符合 他 们 的 偏好 ? 

。 是 否 是 兴趣 推荐 ? 

。 是 否 对 产生 这 种 推荐 的 系统 满意 ? 

对 特殊 推荐 项 目的 重要 问题 需要 用 语言 着 重 标 出 ， 而 不 是 把 整个 推荐 列表 作为 一 个 整 
体 ， 因 为 整个 推荐 列表 不 可 能 对 提高 推荐 系统 有 所 帮助 。 搜 集 有 关 个 体 项 目的 信息 能 够 识 
别 推荐 设计 的 弱点 和 缺陷 。 例 如 ， 有 关 TV 推荐 的 一 个 项 目 ， 就 可 以 研究 为 什么 一 个 成 功 
的 推荐 系统 能 够 接受 少量 的 异常 奇异 满意 评分 。 奇 异 点 研究 能 够 发 现 不 能 被 元 数据 确定 的 
外 语 内 容 推荐 。 因 此 设计 团队 通过 修改 ， 使 得 系统 能 够 更 智能 地 识别 和 处 理 外 语 内 容 类 
别 ， 并 解决 不 满意 的 问题 。 

对 数据 的 分 析 可 以 解决 用 户 可 能 的 深层 次 的 满意 度 ， 这 也 可 以 直接 比较 竞争 系统 间 的 
结果 ， 这 些 系统 可 以 应 用 于 基准 测试 ， 还 可 以 对 设计 方向 的 决策 产生 反馈 。 

10. 4.2.4 日 志 研 究 


一 旦 一 个 推荐 系统 应 用 于 一 个 领域 ， 从 中 长 远 的 角度 上 如 何 收集 信息 才能 算是 一 个 成 
功 的 开发 。 在 系统 中 收集 应 用 机 制 不 能 获取 应 用 系统 中 的 主观 动因 、 欢 喜 或 者 诅 形 。 推 荐 
系统 的 一 个 重要 考虑 因素 是 在 较 长 时 间 内 对 不 断 变化 的 用 户 体验 的 长 期 学 习 。 在 线 系统 整 
体 经 验 的 案例 分 析 比 简单 的 满意 度 更 有 意义 。 日 记 研 究 可 以 从 一 周到 几 个 月 做 什么 事情 ， 
取决 于 研究 的 系统 和 参与 用 户 的 时 机 。 当 直接 观察 或 者 监督 变 得 非常 困难 时 ， 基 于 日 记 的 
研究 特别 适用 于 移动 上 下 文 环境 。 我 们 最 近 已 经 使 用 这 种 方法 做 了 研究 ， 这 个 研究 涉及 在 
没有 远程 用 户 日 志 的 不 同 移动 设备 上 不 同 视频 内 容 案例 场景 的 影响 评估 。 此 方法 被 证 明 在 
识别 用 户 特定 关键 点 方面 有 较 好 的 效果 。 
| 事实 上 ， 日 志 在 社会 研究 的 许多 领域 中 是 一 种 成 熟 的 方法 (例如 ， 在 文献 [10] 中 的 实 
例 )。 此 方法 依赖 于 用 户 在 与 感 兴趣 系统 之 间 日 复 一 日 的 互动 过 程 中 创建 的 自我 报告 记录 
( 它 涉 及 真实 用 户 用 其 特有 的 语言 描述 的 上 下 文 环境 )。 从 这 些 能 够 被 集成 提升 系统 的 数据 
中 获得 信息 ， 已 经 为 下 一 代 推 荐 系统 的 发 展 用 来 发 现 用 户 需求 和 上 下 文 问 题 。 根 据 此 方法 
的 流程 ， 以 下 可 能 的 几 点 缺陷 需要 考虑 : 

。 用 户 的 招募 和 保持 : 在 长 期 研究 过 程 中 往往 很 难 招募 到 用 户 ， 而 且 保留 他 们 更 加 困难 。 

。 日 记 无 报告 或 者 虚假 记录 : 完成 整个 日 志 需 要 许多 付出 和 努力 ， 对 于 用 户 来 说 坚 

持 整 个 研究 过 程 很 困难 。 

为 了 成 功 地 完成 日 记 研究 ， 与 参与 者 持久 地 保持 联系 是 非常 重要 的 。 定 期 面对面 或 者 
电话 汇报 ， 以 灌输 研究 人 员 的 期 望 、 监 督 数据 的 采集 、 询 问 最 近 上 报 的 事件 或 评论 等 方 
式 ， 鼓 励 用 户 持续 地 完成 他 们 的 日 记 。 这 种 策略 可 以 用 来 区 分 可 能 导致 用 户 满意 或 者 不 满 
意 情节 的 关键 事件 。 

同时 没有 详细 的 列表 ， 这 一 系列 的 方法 在 开发 过 程 中 具有 一 定 的 用 途 ， 从 早期 的 设计 
阶段 、 原 型 开发 到 最 终 发 布 以 及 后 续 的 发 布 版 本 。 
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10.5 应 用 实例 : 一 个 语义 新 闻 推 荐 系统 


在 前 面 的 内 容 中 ， 我 们 提出 了 一 种 建立 推荐 系统 的 方法 : 通过 对 三 个 模型 (应 用 、 用 
户 和 数据 ) 的 实例 化 ， 来 迫使 设计 者 考虑 推荐 系统 设计 可 能 的 选择 。 在 此 节 中 ， 将 从 这 些 
模型 中 获取 的 东西 与 一 个 实际 应 用 系统 (新 闻 专 业 人 士 或 者 最 终 用 户 能 够 创建 一 个 新 闻 市 
场 ， 在 那里 以 个 性 化 的 方式 共享 和 买卖 多 媒体 内 容 ) 内 能 做 的 东西 进行 比较 。 


10.5.1 背景 : MESH 工程 


通过 对 MESH 的 描述 ， 说 明 对 推荐 系统 设计 有 帮助 的 模型 的 有 用 性 。MESH2 (Multi- 
media sEmantic Syndication for enHanced news Services) 是 一 个 研究 项 目 ， 在 这 个 项 目 中 
我 们 参与 设计 了 一 个 用 于 智能 产生 和 发 送 语义 增强 多 媒体 新 闻 信 息 的 框架 模型 L52] 。 

MESH 的 主要 目的 是 为 新 闻 专 业 人 士 和 最 终 用 户 提 供 有 效 的 方法 组 织 、 定 位 、 使 用 
和 发 布 大 规模 的 、 异 构 的 多 媒体 信息 。 一 个 MESH 系统 是 一 个 新 闻 内 容 传播 过 程 的 中 间 
者 ， 能 够 利用 多 媒体 内 容 网 页 为 用 户 提供 导航 ， 为 用 户 自动 寻找 其 感 兴趣 或 者 需要 的 信 
息 ， 并 将 其 以 尽 可 能 好 的 方式 展示 在 任何 终端 上 。 核 心思 想 的 构成 如 图 10.2: 1) 基 于 半 自 
动 语义 提取 元 数据 和 用 户 计算 偏好 ， 把 内 容 信 息 分 发 给 用 户 ( 推 送 模型 ); 2) 个 性 化 的 多 媒 
体 摘要 可 以 轻松 承受 大 规模 的 信息 ， 通 过 导航 辅助 设备 ， 提 供 进一步 使 用 信息 的 初始 入 口 
连接 ， 避 免 " 网 络 迷失 ”综合 症 ; 3) 通 过 固定 移动 渠道 ， 先 进 的 聚合 方法 可 以 把 新 闻 从 根源 
(记者 ) 到 最 终 用 户 快 速 分 发 ， 提 出 新 的 灵活 协同 业务 模式 。 





图 10.2 MESH 平台 的 示意 图 


在 这 种 背景 下 ， 个 性 化 的 作用 是 : 1) 使 系统 能 够 积极 推送 给 用 户 个 性 化 新 闻 项 目 或 个 
性 化 的 多 媒体 新 闻 摘要 ;， 2) 支持 用 户 ( 专 业 人 士 和 最 终 用 户 ) 个 性 化 的 新 闻 搜索 。 


10.5.2 MESH 的 环境 模型 


基于 上 述 应 用 描述 ， 为 了 确定 推荐 系统 设计 的 约束 条 件 ， 我 们 可 以 举例 说 明 如 何 实例 
化 在 10. 3 节 中 描述 的 环境 模型 。 


© MESH IST project(FP6-027685) (03/2006-02/2009) , http; // www. mesh-ip. eu 


10.5.2..1 


推荐 系统 用 途 


推荐 系统 类 型 
具有 导航 功能 的 整合 


性 能 准则 


支持 该 应 用 的 设备 
用 户 数 
应 用 基础 设施 


屏幕 实际 尺寸 
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环境 模型 的 实例 化 


表 10.4 应 用 模型 实例 


提升 系统 效率 ， 为 专业 用 户 ( 节 约 采 集 新 闻 信 息 的 时 间 ， 如 为 某 个 特定 的 主题 建立 一 
个 “档案 ”)， 为 最 终 用户 ( 接 收 或 者 浏览 与 他 们 的 资料 、 最 近 的 兴趣 、 当 前 的 状态 或 者 最 
近 的 查询 相关 的 新 闻 ) 


多 个 推荐 物品 ， 提 供 一 个 多 媒体 新 闻 文档 的 推荐 列表 
紧密 的 ， 如 通过 与 信息 检索 的 耦合 来 提供 个 性 化 搜索 服务 


取决 于 系统 用 户 的 类 型 ， 不 同 的 准则 具有 一 个 原始 的 重要 性 : 记者 和 专业 用 户 对 正确 
性 、 响 应 速度 、 可 靠 性 和 健壮 性 更 加 感 兴趣 ， 而 最 终 用 户 对 正确 性 、 透 明度 、 人 惊喜 度 更 
加 感 兴趣 * 


主要 的 固定 设备 (该 应 用 只 有 一 部 分 有 限 的 功能 在 移动 设备 上 是 可 用 的 ) 
单 用 户 应 用 


基于 浏览 器 的 应 用 ， 具 有 两 个 内 容 分 发 模式 : 拉 取 模式 (pull mode) (个 性 化 搜索 ) 和 推 
送 模式 (push mode) (多 媒体 新 闻 摘 要 的 主动 分 发 ) 


无 限制 


10.5.2.2 不 同 模型 与 设计 约束 条 件 之 间 的 联系 


在 MESH 工程 中 ， 推 荐 系统 环境 研究 表明 了 每 个 模型 ( 见 表 10. 5 和 表 10. 6) 的 重要 特 
征 ， 彼 此 之 间 是 如 何 相互 影响 ， 以 及 哪 种 特征 对 过 滤 / 推 荐 算法 的 选择 、 推 荐 系统 的 基础 
设计 和 适应 推荐 选择 项 ( 见 图 10. 3) 有 直接 的 影响 。 这 种 模式 在 我 们 分 析 系 统 关键 特征 的 重 
要 部 分 ， 并 当 其 中 一 个 模型 发 生变 化 时 帮助 确定 对 系统 约束 和 要 求 的 影响 。 


人 口 统计 学 信息 
目标 的 存在 性 和 本 质 


期 望 水 平 


期 望 随 着 时 间 变 化 
用 户 环境 的 重要 性 
社交 环境 

信任 和 隐私 问题 


数据 类 型 


元 数据 的 质量 


基于 标准 的 描述 
项 目的 数量 和 多 样 性 


项 目 分 布 
项 目的 稳定 性 和 持久 性 


用 户 评分 


表 10.5 用 户 模型 实例 


只 考虑 工作 作为 具有 歧视 性 的 人 口 因素 : 我 们 将 专业 用 户 ( 如 记者 、 摄 影 师 等 ) 和 最 终 
用 户 区 分 开 

在 拉 取 模式 中 ， 显 性 的 目标 通过 用 户 在 搜索 引擎 的 用 户 查 询 表示 ; 在 推送 模式 中 ， 最 
终 用 户 除 了 通知 他 们 喜欢 的 栏目 和 头条 新 闻 没 有 其 他 目标 ,专业 用 户 需 要 从 拉 取 模式 
中 ， 他 们 的 阅读 项 目 来 检测 和 推断 当前 任务 潜在 的 目标 

中 等 : 即使 推荐 系统 不 能 工作 或 者 性 能 低 ， 用 户 仍然 能 够 使 用 该 系统 ， 推 荐 系统 不 是 
用 户 的 活动 中 心 

是 : 当 逐 渐 发 现 个 性 化 搜索 功能 的 好 处 时 ， 用 户 的 期 望 应 该 增加 

高 : 例如 ， 用 户 在 家 、 在 工作 或 者 假期 不 会 阅读 的 同一 类 的 新 闻 
独自 的 : 新 闻 消 费 生来 就 是 一 个 个 体 化 的 活动 

没有 考虑 (假设 用 户 的 利益 和 个 人 信息 和 数据 的 泄露 之 间 做 有 必要 的 权衡 ) 


表 10.6 数据 模型 实例 

半 结 构 化 的 : 新 闻 物 品 通过 一 系列 的 类 别 和 概念 来 描述 ;应 用 了 一 些 用 来 从 物品 (人文 
本 、 语 音 、 视 频 ) 的 非 结构 化 部 分 提取 元 数据 的 方法 

总 的 来 说 ， 中 等 : 通过 内 容 的 语义 标注 具有 很 好 的 表现 力 ， 但 是 通过 半自动 提取 的 很 
多 元 数据 不 可 靠 

是 : 使 用 基于 IPTC 的 本 体 论 
数量 巨大 的 新 闻 物 品 ， 覆 盖 了 大 量 的 各 种 主题 

长 尾 和 主流 : 概念 分 布 广泛 ， 从 像 奥巴马 选举 这 样 的 主流 事件 到 那些 发 现 新 的 青蛙 物种 
相关 的 新 闻 

新 闻 数 据 集 是 不 持久 的 ， 因 为 它 是 一 个 连续 的 数据 流 ， 所 以 要 考虑 推荐 的 新 闻 物 品 的 
不 断 变化 (通常 超过 一 定 天 数 的 新 闻 要 忽略 掉 ) 

显 式 评分 (如 星 级 评分 ) 和 隐 式 评分 (通过 监控 在 新 闻 物 品 的 单 击 次 数 和 花费 的 时 间 ) 都 
考虑 了 
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相关 用 户 模型 特征 相关 应 用 模型 特征 相关 数据 模型 特征 






)---Em.. 


自 适应 选择 


10.3 MESH 中 的 模型 特征 的 依赖 和 影响 图 


对 推荐 算法 的 影响 : 在 MESH 中 ， 推 荐 的 最 初 目 的 是 提高 系统 的 性 能 ;因此 选择 的 
算法 必须 克服 基于 内 容 的 推荐 和 协同 过 滤 推 荐 的 局 限 性 [7?，14，1]。 利 用 混合 推荐 算法 
[14] 能 够 克服 这 些 局 限 性 。 此 外 ， 不 同类 别 的 用 户 在 一 起 ， 根 据 两 种 不 同 的 模式 ( 推 / 拉 )， 
具有 不 同 的 目的 和 互动 作用 。 在 拉 取 模式 中 ， 推 荐 是 以 用 户 的 查询 为 驱动 而 产生 的 ， 因 此 
偏向 于 使 用 基于 内 容 的 方法 ， 然 而 在 推送 模式 中 ， 对 于 最 终 用 户 ， 可 能 对 协同 过 滤 方 法 带 
来 的 更 好 的 多 样 性 感 兴趣 。 因 此 ， 结 合 基于 内 容 的 方法 和 协同 过 滤 相 结合 的 混合 方法 要 比 
其 中 单一 方法 更 合适 。 另 一 个 争论 是 关于 元 数据 的 : 尽管 有 元 数据 (这 可 能 导致 使 用 基于 
内 容 的 方法 )， 但 是 他 们 的 质量 仍然 是 中 等 的 ， 即 使 不 考虑 推荐 算法 本 身 的 质量 ， 这 都 可 
能 导致 中 等 质量 的 推荐 。 因 此 不 能 只 单 靠 基 于 内 容 的 方法 。 

一 旦 决定 结合 不 同类 型 的 推荐 ， 那 么 设计 者 必须 对 环境 因素 进行 分 析 ， 选 择 更 高 准确 
率 的 方法 。 

。 协同 过 滤 的 方法 : 研究 数据 表明 不 大 可 能 使 用 经 典 的 基于 物品 的 协同 过 滤 [45]， 

因为 物品 有 非常 大 的 量 和 动态 性 (新 闻 每 隔 几 分 钟 都 会 发 生 )， 对 具体 的 新 闻 条 目 
不 可 能 有 大 量 的 用 户 评分 (不 管 隐 式 的 还 是 显 式 的 ) 。 这 种 特别 严重 的 稀 朴 性 要 求 
设计 者 设想 其 他 的 协同 过 滤 方 法 ， 例 如 ， 在 基于 用 户 的 协同 过 滤 中 计算 用 户 相 似 
度 时 利用 用 户 特 征 等 [15]。 

。 基于 内 容 的 方法 ， 高度 结 构 化 的 元 数据 (用 本 体 概念 表达 )， 人 允许 我 们 使 用 更 加 复杂 的 

推荐 方法 ， 利 用 高 度 结构 化 的 元 数据 (用 本 体 概念 表达 )， 可 以 提高 推荐 的 准确 率 [17]。 

最 后 ， 另 一 个 重点 是 确定 如 何 把 这 个 算法 结合 在 一 起 。 基 于 环境 研究 ， 有 多 种 启发 
式 方法 是 可 选 的 : 基于 用 户 类 型 (最 终 用 户 和 专业 人 士 ) 或 者 基于 应 用 模式 ( 拉 取 模式 与 
个 性 化 推送 模式 ) 的 静态 或 者 动态 融合 。 用 户 的 上 下 文 也 可 以 作为 参数 应 用 在 不 同 算法 
及 它们 的 融合 方案 中 。 

此 外 ， 在 新 闻 背 景 下 ， 对 相似 内 容 的 考虑 是 必 不 可 少 的 (例如 ， 有 关 奥 巴 马 选 举 的 
不 同 来 源 新 闻 内 容 )， 因 此 为 了 避免 推荐 重复 的 内 容 ， 需 要 采用 聚 类 等 附加 机 制 。 在 这 
种 情况 下 ， 把 用 户 通常 区 分 两 个 相似 新 闻 物 品 的 标准 融合 到 整个 推荐 过 程 中 是 非常 重 


影响 
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要 的 。 

构建 一 个 可 适应 的 推荐 系统 的 策略 : 新 闻 数 据 研究 表明 新 闻 物 品 ( 新 的 新 闻 物 品 
快速 产生 ) 和 主题 变动 频繁 。 由 于 新 闻 的 高 波动 性 和 高 覆盖 面 的 特性 ， 对 用 户 的 研究 
证 明 用 户 不 能 完全 表达 他 们 对 相关 新 闻 的 兴趣 ， 所 以 用 户 信息 也 有 一 定 的 变动 性 。 此 
外 ， 在 这 个 系统 中 ， 用 户 可 以 自由 地 浏览 他 们 感 兴趣 的 新 闻 。 必 须 把 用 户 感 兴趣 的 新 
闻 主 题 考虑 在 用 户 模型 中 ， 并 保持 模型 的 实时 更 新 ， 以 便 可 以 将 其 应 用 在 个 性 化 新 闻 
推送 的 过 程 中 。 用 户 模 型 随时 间 的 自动 和 快速 进化 ， 对 于 一 个 可 适应 的 推荐 系统 是 非 
常 必要 的 [38]。 

对 系统 架构 的 影响 : 一 开始 ，MESH 作为 一 种 新 应 用 ， 对 推荐 系统 有 两 种 选择 : 1) 分 布 
式 方法 ; 2) 完 全 集中 式 方法 。 分 布 式 方法 有 以 下 优点 : 很 好 的 隐私 管理 和 应 用 的 独立 性 ; 同 
时 也 存在 许多 严重 的 缺陷 : 在 不 同 的 设备 使 用 应 用 时 ， 需 要 在 设备 间 同 步 用 户 配置 文件 及 数 
据 转 换 ， 因 此 后 端 成 本 会 非常 高 。 因 此 ， 决 定 选择 集中 式 系统 ， 它 能 够 简化 推荐 与 系统 的 其 
他 部 分 (如 内 容 检索 和 内 容 整 合 ) 的 集成 。 


10.5.3 实践 : 模型 的 迭代 实例 化 


由 于 推荐 系统 的 构建 是 平行 于 系统 的 其 他 模块 的 ， 所 以 不 可 能 直到 我 们 获得 真实 的 数 
据 才 开始 构建 推荐 系统 。 所 以 ， 决 定 在 公开 数据 集 上 构建 算法 进行 评估 : 

。 对 于 推荐 算法 : 所 有 的 测试 在 MovieLens 和 IMDB 数据 集 上 完成 ; 

。 对 于 用 户 信息 自 适 应 算法 ，BARBS 数 据 。 选 择 此 数据 集 的 原因 在 于 需要 在 内 容 消 

耗 上 进行 时 间 进 化 。 

结果 表明 在 MESH 中 开发 的 混合 推荐 方法 要 比 目 前 先进 方法 (基于 内 容 和 协同 过 滤 ) 
提供 更 加 准确 的 结果 。 在 这 种 情况 下 ， 元 数据 的 质量 接近 我 们 的 期 望 要 求 ， 并 且 用 户 上 下 
文 也 没有 被 考虑 进来 。 因 此 ， 在 BARB 数据 集 (6 个 月 时 间 内 有 关 电 视 节 目 消费 量 的 数据 
集 ) 上 进行 实验 时 ， 我 们 不 由 自主 地 创造 了 一 个 新 的 数据 模型 和 一 个 稍 有 变化 的 用 户 模型 ; 

。 数据 模型 : 物品 是 用 有 限 的 元 数据 描述 的 电视 节目 ， 其 中 元 数据 中 包括 节目 的 高 

层次 类 别 以 及 从 节目 描述 文档 中 提取 的 关键 词 。 物 品 的 分 布 是 带 有 从 低级 到 中 级 
的 注释 质量 的 主流 分 布 。 物 品 的 稳定 性 也 不 相同 ， 由 于 电视 节目 可 以 适用 于 很 长 
的 一 段 时 间 ， 所 以 我 们 可 以 把 它们 看 成 相当 稳定 的 (电视 具有 明显 的 重复 性 ， 但 是 
新 闻 节 目 不 能 每 天 都 重复 ) 。 该 数据 集 改 变 了 影响 推荐 性 能 的 两 个 特征 : 元 数据 的 
质量 和 物品 的 分 布 ， 影 响 适 应 性 结果 的 一 个 特征 也 被 改变 了 : 物品 的 稳定 性 。 

。 用 户 模型 : 在 BARB 数据 中 没有 专业 用 户 ， 因 此 没有 与 特殊 目的 相关 联 的 推荐 。 

对 推荐 的 准确 率 具 有 主要 的 影响 。 

BARB 本 可 以 帮助 我 们 评估 用 户 偏 好 学 习 算 法 ， 但 是 经 过 一 周 的 学 习 结果 表明 用 户 特 征 
仍然 是 稳定 的 ， 也 就 是 说 偏好 学 习 机 制 对 用 户 偏 好 并 没有 多 大 影响 2 。 因 此 不 仅 需要 根据 算 
法 自身 的 运行 状况 解释 我 们 的 实验 结果 ， 还 要 从 算法 的 行为 和 所 选择 的 数据 集 的 特征 来 解释 
实验 结果 。 整 个 算法 本 来 是 用 来 处 理 大 量 的 物品 的 ， 非 持久 的 、 并 且 带 有 高 质量 元 数据 的 主 
流 长 尾 分 布 。 假 设 算法 是 非常 被 动 反应 的 ， 而 且 建 立 在 基于 物品 的 平均 消费 极 大 优 于 TV 节 
目的 每 天 消费 之 上 。 通 过 这 个 实验 ， 我 们 认识 到 改变 推荐 环境 (数据 、 用 户 和 应 用 模型 ) 对 预 
期 结果 、 过 滤 算 法 的 推荐 解释 及 其 他 与 推荐 系统 相关 的 机 制 都 有 巨大 的 影响 。 
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因此 ， 我 们 尽 可 能 利用 与 MESH 系统 中 相似 的 数据 。 利 用 一 个 称 为 "New@Hand "的 
工具 启动 新 的 实验 。New@Hand 结合 文本 特征 和 协同 信息 为 最 终 用 户 提供 新 闻 推荐 。 通 
过 RSS 反馈 从 多 种 在 线 新 闻 服 务 中 对 新 闻 项 目 进行 自动 定期 更 新 。 新 闻 的 主题 、 摘 要 和 类 别 用 系 
统 本 体 概念 进行 标记 。 在 三 周 时间 内 ， 利 用 主观 定性 评分 方法 ( 见 10.4.2.3 W, 分析 了 偏好 学 习 
算法 对 20 个 用 户 性 能 (为 了 比较 算法 的 不 同 配置 的 学 习性 能 ， 将 用 户 分 到 不 同 小 组 )。 由 于 在 此 实 
验 中 的 数据 模型 与 MESH 中 的 相似 ， 用 户 模型 有 轻微 的 不 同 ， 得 到 了 基本 相似 的 实验 结果 。 

通过 数据 、 用 户 和 应 用 模型 的 实例 化 ， 对 推荐 环境 进行 详细 的 研究 ， 并 区 分 模型 特征 
的 相关 性 和 影响 力 ， 为 了 避免 错误 和 在 死角 上 浪费 时 间 ， 我 们 认为 在 设计 阶段 必须 解决 掉 
这 些 关键 问题 。 


10.6 总 结 


本 章 中 说 明了 尽管 有 多 种 不 同 的 可 用 技术 能 够 用 于 实现 一 个 推荐 系统 ， 但 是 往往 很 难 
进行 比较 ， 一 个 系统 的 环境 评估 是 做 出 适当 选择 的 关键 。 为 此 我 们 构建 了 对 推荐 系统 设计 
有 重要 影响 的 环境 特征 的 三 种 模型 应用、 用 户 和 数据 。 构 建 这 三 种 模型 和 研究 它们 之 间 
的 相互 作用 ， 可 以 对 适当 的 推荐 算法 、 系 统 结构 和 用 户 模型 进行 优化 选择 。 

在 实际 中 (如 我 们 演示 的 实例 )， 这 三 种 模型 不 能 一 次 性 地 完成 一 个 完美 的 设计 。 但 是 
它们 对 和 迭代 设计 方法 是 非常 有 用 的 支持 ， 这 是 超越 卓越 的 技术 以 及 实现 最 终 的 目标 的 最 佳 
方式 : 用 户 满 意 度 。 


参考 文献 


1. Adomavicius, G., Tuzhilin, E.: Toward the next generation of recommender systems: A survey 
of the state-of-the-art and possible extensions. IEEE Transactions on Knowledge and Data 
Engineering 17(6), 734—749 (2005) 

2. Agrawal, R., Imielinski, T., Swami, A.: Mining association rules between sets of items in 
large databases. In: Proceedings of the 1993 ACM SIGMOD International Conference on 
Management of Data, vol. 22, pp. 207-216. ACM (1993) 

3. Ali, K., van Stam, W.: Tivo: making show recommendations using a distributed collaborative 
filtering architecture. In: Proceedings of the tenth ACM SIGKDD international conference on 
Knowledge discovery and data mining. Seattle, WA, USA (2004) 

4. Anand, S.S., Mobasher, B.: Contextual recommendation. In: From Web to Social Web: Dis- 
covering and Deploying User and Content Profiles, Lecture Notes in Computer Science, pp. 
142-160. Springer-Verlag (2007) 

. Anderson, C.: The long tail. Wired (2004) 

. Ardissono, L., Goy, A., Petrone, G., Segnan, M., Torasso, P.: Intrigue: Personalized recom- 
mendation of tourist attractions for desktop and handset devices. In: Applied Artificial Intel- 
ligence, pp. 687-714. Taylor and Francis (2003) 

7. Balabanovi¢, M., Shoham, Y.: Fab: content-based, collaborative recommendation. Communi- 
cations of the ACM 40(3), 66-72 (1997) 

8. Bernhaupt, R., Wilfinger, D., Weiss, A., Tscheligi, M.: An ethnographic study on recommen- 
dations in the living room: Implications for the design of itv recommender systems. In: EU- 
ROITV’08: Proceedings of the 6th European conference on Changing Television Environ- 
ments, pp. 92-101. Springer-Verlag (2008) 

9. Bias, R., Mayhew, D.: Cost-Justifying usability. Morgan Kaufman Publishing (1994) 

10, Bolger, N., Davis, A., Rafaeli, E.: Diary methods: Capturing life as it is lived. In Annual 
Review of Psychology 54(1), 579-616 (2003) 

11. Bonnefoy, D., Bouzid, M., Lhuillier, N., Mercer, K.: More like this or not for me: Delivering 
personalised recommendations in multi-user environments, In; UM'07: Proceedings of the 
11th international conference on User Modeling, pp. 87-96. Springer-Verlag (2007) 

12. Bonnefoy, D., Drgehorn, O., Kernchen, R.: Enabling Technologies for Mobile Services: The 


ON tA 


13. 


14. 


I5. 


16. 


17. 


18. 


19. 


20. 


21; 
22. 
23. 


24. 


25. 


26. 


27. 


28. 


29. 


30. 


31. 


32. 


33. 


34. 


35. 


36. 


$10€ 走出 实验 室 的 推荐 系统 


Mobilife Book, chap. Multimodality and Personalisation. John Wiley & Sons Ltd (2007) 
Bonnefoy, D., Picault, J., Bouzid, M.: Distributed user profile. Patent applications EP1934901, 
GB2430281 & WO2007037870 (2005) 

Burke, R.: Hybrid recommender systems: Survey and experiments. User Modeling and User- 
Adapted Interaction 12(4), 331—370 (2002) 

Cantador, I.: Exploiting the conceptual space in hybrid recommender systems: a semantic- 
based approach. Ph.D. thesis, Universidad Autnoma de Madrid (UAM), Spain (2008) 
Cantador, I., Bellogn, A., Castells, P.: News hand: A semantic web approach to recommend- 
ing news. In: Proceedings of the 5th International Conference on Adaptive Hypermedia and 
Adaptive Web-Based Systems (AH 2008), Lecture Notes in Computer Science, vol. 5149, pp. 
279-283. Springer-Verlag (2008) 

Cantador, I., Fernández, M., Vallet, D., Castells, P., Picault, J., Ribiére, M.: Advances in Se- 
mantic Media Adaptation and Personalization, Studies in Computational Intelligence, vol. 93, 
chap. A Multi-Purpose Ontology-Based Approach for Personalised Content Filtering and Re- 
trieval, pp. 25-51. Springer (2008) 

Cantador, I., Szomszor, M., Alani, H., Fernández, M., Castells, P.: Enriching ontological user 
profiles with tagging history for multi-domain recommendations. In: Proceedings of the 1st 
International Workshop on Collective Semantics: Collective Intelligence and the Semantic 
Web (CISWeb 2008), pp. 5-19 (2008) 

Cunningham, H., Maynard, D., Bontcheva, K., Tablan, V.: Gate: A framework and graphical 
development environment for robust nlp tools and applications. In: Proceedings of the 40th 
Anniversary Meeting of the Association for Computational Linguistics (ACL'02) (2002) 
Dong, J., Martin, S., Waldo, P.: A conference on human factors in computing systemser input 
and analysis tool for information architecture. In: Conference on Human Factors in Computing 
Systems, pp. 23-24 (2001) 

Duda, R.O., Hart, P., Stork, D.G.: Pattern Classification. John Wiley, New York (2001) 

Gilb, T.: Principles of software engineering management. Arron Marcus Associates (1988) 
Ha, S.H.: An intelligent system for personalized advertising on the internet. LNCS 3182 pp. 
21-30 (2004) 

Herlocker, J.L., Konstan, J.A., Riedl, J.: Explaining collaborative filtering recommendations. 
In: CSCW'00: Proceedings of the 2000 ACM conference on Computer supported cooperative 
work, pp. 241—250. ACM, New York, NY, USA (2000) 

Herlocker, J.L., Terveen, L.G., Konstan, J.A., Riedl, J.T.: Evaluating collaborative filtering 
recommender systems. ACM Transactions on information systems 22, 5—53 (2004) 
International Organisation for Standardisation (ISO): ISO 13407: Human centred design pro- 
cesses for interactive systems. 

Jameson, A., Baldes, S., Kleinbauer, T.: Two methods for enhancing mutual awareness in a 
group recommender system. In: AVI’04: Proceedings of the working conference on Advanced 
visual interfaces, pp. 447—449. ACM, New York, NY, USA (2004) 

Lhuillier, N., Bonnefoy, D., Bouzid, M., Millerat, J., Picault, J., Ribiére, M.: A recommenda- 
tion system and method of operation therefor. Patent application WO2008073595 (2006) 
Lhuillier, N., Bouzid, M., Gadanho, S.: Context-sensitive user preference prediction. Patent 
application GB2442024 (2006) 

Lhuillier, N., Bouzid, M., Mercer, K., Picault, J.: System for content item recommendation. 
Patent application GB2438645 (2006) 

Masthoff, J.: Group modeling: Selecting a sequence of television items to suit a group of 
viewers. User Modeling and User-Adapted Interaction 14(1), 37-85 (2004) 

McCarthy, K., Salamó, M., Coyle, L., McGinty, L., Smyth, B., Nixon, P.: Cats: A synchronous 
approach to collaborative group recommendation. In: G. Sutcliffe, R. Goebel (eds.) Proceed- 
ings of the Nineteenth International Florida Artificial Intelligence Research Society Confer- 
ence, pp. 86-91. AAAI Press (2006) 

McNee, S.M., Riedl, J., Konstan, J.A.: Accurate is not always good: How accuracy metrics 
have hurt recommender systems. In: CHI'06 extended abstracts on Human factors in comput- 
ing systems, pp. 1097-1101. ACM, New York, NY, USA (2006) 

Mobasher, B., Burke, R., Bhaumik, R., Williams, C.: Toward trustworthy recommender sys- 
tems: An analysis of attack models and algorithm robustness. ACM Trans. Internet Technol. 
7(4) (2007) > 

Mobasher, B., Jin, X., Zhou, Y.: Semantically enhanced collaborative filtering on the web. 
Web Mining: FromWeb to SemanticWeb pp. 57—76 (2004) 

Oppenheim, A.: Questionnaire Design, Interviewing and Attitude Measurement. Continuum 
International Publishing, New York (2001) 


245 


246 


第 二 部 分 推荐 系统 的 应 用 与 评估 


37. 


38. 


39. 


40. 


41. 


42. 


43. 


44. 


45. 


46. 


47. 


48. 


49. 


50. 


51. 


32. 


53. 


54. 


55. 


Papadogiorgaki, M., Papastathis, V., Nidelkou, E., Kompatsiaris, Y., Waddington, S., Bratu, 
B., Ribière, M.: Distributed user modeling for personalized news delivery in mobile devices. 
In: 2nd International Workshop on Semantic Media Adaptation and Personalization (2007) 
Picault, J., Ribiére, M.: An empirical user profile adaptation mechanism that reacts to shifts 
of interests. Submitted to the 18th European Conference on Artificial Intelligence (2008). 
http://www.mesh-ip.eu/upload/ecai2008.pdf 

Picault, J., Ribière, M.: Method of adapting a user profile including user preferences and 
communication device. European Patent EP08290033 (2008) 

Ribiére, M., Picault, J.: Progressive display of user interests. Tech. rep., Motorola (2008). 
https://priorart.ip.com/download/IPCOM000167391D/ 

Ribière, M., Picault, J.: Method and apparatus for modifying a user preference profile. Patent 
application WO2009064585 (2009) 

Rich, E.M.: User modeling via stereotypes. Cognitive Science 3, 329-354 (1979) 

Rokach, L. and Maimon, O. and Arbel, R., Selective voting-getting more for less in sensor 
fusion, International Journal of Pattern Recognition and Artificial Intelligence 20(3):329-350 
(2006) 

Rugg, G., McGeorge, P.: The sorting techniques: a tutorial paper on card sorts, picture sorts 
and item sorts. Expert Systems, The journal of Knowledge Engineering 14(2), 80-93 (2002) 
Sarwar, B., Karypis, G., Konstan, J., Riedl, J.: Item-based collaborative filtering recommen- 
dation algorithms. In: WWW’01: Proceedings of the 10th international conference on World 
Wide Web, pp. 285-295. ACM, New York, NY, USA (2001) 


Shepherd, M.: Tutorial on personalization and filtering on the web. Web 
Information Filtering Lab, Dalhousie University, Canada. http://ncsi- 
net.ncsi.iisc.ernet.in/gsdl/collect/icco/index/assoc/HASHO! 1b.dir/Tutorial-Shepherd.ppt 
Shoval, P., Maidel, V., Shapira, B.: An ontology-content-based filtering method. International 
Journal of Information Theories and Applications (15), 303-318 (2008) 

Sieg, A., Mobasher, B., Burke, R.: Ontological user profiles for personalized web search. In: 
Proceedings of AAAI 2007 Workshop on Intelligent Techniques for Web Personalization, pp. 
84—91. Vancouver, BC, Canada (2007) 

Signa, R.: Design strategies for recommender systems. UIE Web App Summit. 
http://www.slideshare.net/rashmi/design-of-recommender-systems 

Snyder, C.: Paper prototyping: The fast and east way to design and refine user interfaces. 
Morgan Kaufmann Publishing, San Francisco (2003) 

Terveen, L., Hill, W.: Human-Computer Interaction in the New Millennium, chap. Beyond 
Recommender Systems: Helping People Help Each Other, pp. 487-509 

Villegas, P., Sarris, N., Picault, J., Kompatsiaris, I.: Creating a mesh of multimedia news feeds. 
In: European Workshop on the Integration of Knowledge, Semantics and Digital Media Tech- 
nologies (EWIMT), pp. 453-454. IEE (2005) 

Yu, Z., Zhou, X., Hao, Y., Gu, J.: Tv program recommendation for multiple viewers based on 
user profile merging. User Modeling and User-Adapted Interaction 16(1), 63-82 (2006) 
Zhang, M., Hurley, N.: Avoiding monotony: improving the diversity of recommendation lists. 
In: RecSys'08: Proceedings of the 2008 ACM conference on Recommender systems, pp. 123- 
130. ACM, New York, NY, USA (2008) 

Ziegler, C.N., McNee, S.M., Konstan, J.A., Lausen, G.: Improving recommendation lists 
through topic diversification. In: WWW’05: Proceedings of the 14th international conference 
on World Wide Web, pp. 22-32. ACM, New York (2005) 


| 第 11 章 


Recommender Systems Handbook 


匹配 推荐 系统 的 技术 与 领域 





Robin Burke 和 Maryam Ramezani 


摘要 ”推荐 系统 涉及 的 技术 和 方法 极其 广泛 。 本 章 旨 在 帮助 研究 人 员 和 开发 者 分 辨 各 
种 推荐 技术 最 适合 应 用 的 推荐 领域 。 不 同 于 其 他 对 推荐 系统 的 分 类 ， 本 章 的 关注 点 在 于 知 
识 问 题 。 例 如 ， 推 荐 系统 工作 需要 知识 的 种 类 ， 以 及 这 些 知 识 的 来 源 。 不 同 的 推荐 领域 
〈 以 图 书 和 公寓 为 例 ) 将 提供 不 同 的 收集 和 应 用 知识 的 机 会 。 基 于 上 述 内容 产 生 了 如 何 将 领 
域 特 点 和 推荐 技术 结合 的 问题 。 


11.1 简介 


不 同 于 其 他 软件 系统 ， 如 统计 计算 软件 包 或 地 理 信 息 系统 那样 存储 和 使 用 一 类 特定 的 
数据 ， 推 荐 系统 被 定义 为 一 种 特殊 类 型 的 程序 。 它 被 定义 为 一 种 与 用 户 交 互 的 系统 ， 具 体 
指 :“ 推 荐 系统 是 任何 以 产生 个 人 推荐 作为 输出 的 系统 ， 或 者 是 用 个 性 化 手段 对 用 户 的 偏 
好 产生 引导 的 系统 ， 或 者 是 在 大 量 可 能 选择 性 空间 中 提供 有 效 参考 的 系统 .”[11] 这 一 宽泛 
的 定义 使 得 推荐 系统 的 研究 领域 极为 广泛 ， 但 是 对 开发 者 而 言 却 很 难 提供 指导 。 由 此 产生 
了 一 个 关键 的 问题 ， 即 如 何 有 针对 性 地 应 用 某 些 技术 去 解决 相应 的 推荐 问题 。 本 章 将 重点 
阐述 如 何 解 决 该 问题 。 


11.2 相关 工作 


针对 推荐 系统 的 分 类 方式 有 很 多 。Burks[11] 的 论文 区 分 了 5 类 主要 的 推荐 技术 ， 包 
括 : 协同 过 滤 、 基 于 内 容 的 推荐 、 基 于 效用 的 推荐 、 基 于 人 口 统计 的 推荐 和 基于 领域 知识 
的 推荐 。 论 文 讨论 了 每 种 技术 的 优 缺 点 ， 并 且 为 减少 使 用 单一 技术 带 来 的 弊端 ， 论 文中 提 
出 了 混合 推荐 系统 以 提高 系统 性 能 。 他 认为 ， 相 比 于 单一 的 推荐 技术 ， 在 有 效 降 低 召 回 率 
的 同时 ， 混 合 推荐 系统 可 以 取得 更 好 的 推荐 效果 。 推 荐 系统 的 早期 工作 [54] 主 要 聚焦 于 协 
同 过 滤 推 荐 算法 ， 协 同 过 滤 将 推荐 系统 划分 为 5 个 确定 的 维度 ， 并 且 在 这 些 维度 空间 设计 
推荐 系统 。 维 度 描述 了 用 户 与 推荐 系统 交互 的 属性 以 及 用 户 评价 的 聚集 程度 。Konstan 和 
Schafer[61] 提 出 了 一 种 基于 电子 商务 应 用 的 协同 过 滤 推 荐 技术 的 分 类 方法 。 其 将 相应 推荐 
分 为 三 个 大 类 : 功能 性 输入 输出 、 推 荐 方法 以 及 其 他 设计 需要 。 例 如 ， 个 性 化 程度 和 传递 
方式 。 下 面 提出 一 种 基于 双 主 要 准则 的 八 维度 推荐 系统 分 类 方式 : 用 户 配置 文件 的 生成 与 
维护 ， 以 及 用 户 配置 文件 的 开发 技术 。 按 这 种 分 类 方式 ， 传 统 的 推荐 系统 模式 被 抽象 为 在 
相同 领域 下 对 系统 的 分 析 。 最 新 的 关于 推荐 系统 [3] 的 综述 将 推荐 方法 分 为 基于 内 容 的 推 
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荐 、 协 同 过 滤 推 荐 以 及 混合 推荐 三 类 ， 并 且 在 每 类 中 将 推荐 器 具体 划分 为 基于 启发 式 的 算 
法 和 基于 模型 的 算法 两 种 。 

该 工作 与 先前 的 分 类 方法 不 同 ， 其 不 再 以 特定 的 兴趣 维度 作为 划分 现 有 推荐 系统 的 标 
准 ， 而 是 一 种 以 人 工 智 能 为 核心 的 探索 方法 ， 关 注 于 推荐 系统 所 需 知 识 的 来 源 以 及 加 诸 其 
上 的 各 类 限制 条 件 。 本 章 讨论 了 如 何 将 不 同 的 推荐 技术 应 用 于 不 同类 型 的 实际 问题 ， 以 期 
在 推荐 技术 选择 时 给 予 指导 意见 。 从 内 容 本 身 角 度 而 言 ， 本 章 起 到 为 推荐 系统 开发 者 提供 
技术 指导 的 作用 。 | 


11.3 知识 源 


对 一 个 人 工 智 能 系统 开发 者 而 言 ， 在 开始 工作 之 前 首先 确定 系统 用 到 的 知识 来 源 和 知 
识 类 型 。 就 推荐 系统 而 言 ， 应 该 有 两 项 主要 基本 知识 : 推荐 系统 是 个 性 化 的 ， 因 此 必须 包 
含 关于 用 户 的 知识 ; 还 必须 包含 关于 所 推荐 物品 的 特征 信息 。 

不 需要 物品 特征 信息 和 领域 知识 被 认为 是 协同 过 滤 的 主要 优势 之 一 ， 而 其 他 的 推荐 技 
术 需 要 特征 信息 。 

对 于 具体 的 推荐 实例 ， 我 们 面 对 的 是 一 个 特定 的 用 户 并 且 争 取 为 他 提供 个 性 化 推荐 。 
这 种 情况 下 ， 我 们 将 关于 用 户 的 知识 分 为 两 类 : 关于 目标 用 户 的 知识 和 关于 整个 用 户 群 的 
知识 。 因 此 推荐 过 程 中 将 会 用 到 三 大 类 知识 : 

。 tH: 关于 整个 用 户 群体 而 不 是 目标 用 户 的 知识 。 

。 个 人 : 关于 目标 用 户 的 知识 。 

。 内 容 : 关于 将 要 被 推荐 的 物品 的 知识 ， 以 及 泛 指 其 用 途 方面 的 知识 。 

Felfrening 和 Burke 在 文献 [18] 中 介绍 了 一 种 推荐 所 需 知 识 的 分 类 方法 。 图 11. 1 展示 
了 这 种 分 类 : 进一步 细 化 每 个 类 别 的 子 类 型 的 知识 ， 所 有 的 这 些 知识 都 已 经 被 应 用 在 一 些 
现 有 的 推荐 系统 中 。 下 面 将 详细 介绍 这 些 子 类 型 知识 。 


EFX 
i we na 
行为 


人 口 统计 
评分 
评价 < 一 标签 
行为 评论 
人 口 统计 一 询问 
需求 约束 
E 
物品 特征 目的 -手段 
内 容 < 领域 知识 < 特征 本 体 论 
上 下 文 知识 œ 领域 约束 


图 11.1 推荐 系统 中 的 知识 源 分 类 


社 群 知识 是 系统 中 存储 的 所 有 用 户 信息 的 总 和 。 通 常 通过 最 简单 的 用 户 文件 类 型 ， 协 
同 过 滤 推 荐 提升 了 社 群 知识 的 使 用 ， 比 如 ， 用 户 评 价 分 为 喜欢 或 不 喜欢 。 该 方式 常用 在 如 


知识 源 个 入 
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MovieLens 和 其 他 知名 的 推荐 网 站 中 。 当 然 其 他 类 型 的 知识 也 会 产生 一 定 的 作用 ， 在 
I-SPY 协同 过 滤 搜 索 应 用 网 站 中 ， 网 站 会 记录 那些 与 用 户 选择 项 (选择 链接 ) 相 关联 的 用 户 
查询 词 (请 求 )L63]。 基 于 用 户 的 人 口 统计 信息 也 被 应 用 于 推荐 系统 中 。 

个 人 知识 通过 推荐 系统 主导 了 特定 的 用 户 交 互 。 个 人 知识 在 推荐 的 过 程 中 有 两 种 情 
况 ， 一 种 情况 是 把 用 户 的 过 去 特定 浏览 记录 作为 推荐 的 启动 数据 (这 种 情况 下 语义 相对 是 
模糊 的 ) ， 另 一 种 情况 是 在 推荐 开始 之 前 或 过 程 中 用 户 自己 提供 他 们 的 兴趣 偏好 (这 种 情况 
下 语义 是 相对 明晰 的 ) 。 除 了 行为 、 评 价 和 针对 社会 范畴 的 人 口 统计 学 知识 ， 个 人 的 需求 
更 容易 被 发 现 。 举 例 来 说 ， 评 论 系 统 是 一 种 基于 知识 的 推荐 系统 。 一 个 用 户 对 于 推荐 物品 
的 测试 以 及 对 于 多 维 评论 的 回馈 将 对 下 一 轮 检索 的 偏好 产生 约束 ( 且 / 或 )[12]。 这 种 系统 
与 用 户 的 交互 常常 始 于 用 户 所 表达 的 询问 。 

内 容 知 识 有 多 种 不 同形 式 。 在 最 简单 的 情况 下 ， 系 统 仅 有 关于 将 要 被 推荐 的 物品 特征 
的 知识 。 这 些 知识 可 以 使 系统 学 习 用 户 偏好 的 特征 。 领 域 知识 往往 表示 更 加 复杂 的 内 容 知 
识 概念 。 如 手段 -目的 知识 ， 这 个 知识 是 针对 这 种 情况 ， 即 用 户 所 考虑 什么 样 的 手段 /特征 
适用 于 什么 样 的 目标 /结果 。 由 于 特征 本 体 让 各 个 特征 相互 产生 关联 ， 所 以 相似 度 和 相 异 
度 才 可 以 被 合理 地 评估 。 域 完整 性 约束 在 防止 推荐 系统 推荐 出 与 领域 要 求 不 一 致 的 物品 时 
起 到 非常 重要 的 作用 。 

在 很 多 应 用 领域 中 ， 上 下 文 是 一 个 很 重要 的 因素 。 上 下 文 往往 在 产生 一 个 合适 的 推荐 中 
具有 重要 的 作用 。 举 例 来 说 ， 如 果 你 想 要 找 一 家 饭店 举行 商务 会 谈 和 要 找 一 AURATGE 
孩子 四 岁 的 生日 聚会 ， 这 两 件 事 的 推荐 将 会 有 很 大 的 不 同 (甚至 用 户 请 求 和 用 户 文件 信息 可 
能 相同 ) 。 在 不 同 的 推荐 算法 研究 (包括 协同 过 滤 算 法 ) 中 基于 上 下 文 的 研究 一 直 是 热点 [2， 
53，31，5，62，70]。 然 而 ， 如 何 最 大 限度 地 发 掘 上 下 文 给 推荐 带 来 的 好 处 甚至 是 如 何 定义 
相关 的 术语 都 是 学 界 探讨 的 问题 。 本 节 将 只 介绍 部 分 关于 上 下 文 在 推荐 系统 中 的 内 容 。 


11.3.1 推荐 类 别 


在 本 书 的 其 他 章节 ， 推 荐 类 别 已 经 阐述 得 很 详细 了 。 但 是 ， 结 合 本 节 主 题 知 识 源 ， 关 
于 推荐 类 别 的 内 容 还 是 值得 继续 讨论 的 ( 见 图 11. 2) 。 

。 协同 过 滤 推 荐 是 用 个 人 知识 与 同类 型 的 社 群 知识 进行 匹配 ， 然后 从 他 或 她 的 同类 

上 推断 出 他 的 偏好 。 通 常 ， 在 协同 过 滤 中 ， 个 体 需 求 是 不 使 用 的 ， 或 者 被 简单 地 
用 作 过 滤器 。 

。 基于 内 容 的 推荐 从 另 一 个 方面 来 说 更 加 关注 于 个 人 的 内 容 ， 使 用 物品 的 特征 和 用 户 的 

评价 去 训练 分 类 器 ， 可 以 使 分 类 器 在 对 用 户 推荐 新 物品 的 时 候 依 据 他 们 的 偏好 。 

。 基于 知识 的 推荐 是 一 个 多 面 手 ， 它 几乎 使 用 了 所 有 的 领域 知识 而 不 仅 是 物品 特征 。 

图 11. 2 显示 了 知识 源 和 推荐 类 别 的 关系 。 

如 果 用 透视 的 方法 来 看 知识 源 ， 那 么 混合 推荐 结合 了 多 种 知识 源 ， 与 上 面 所 讨论 过 的 
传统 推荐 类 别 有 所 不 同 。 当 我 们 需要 把 只 能 适用 于 一 种 知识 源 的 推荐 算法 改造 成 可 以 适用 
于 其 他 相关 的 知识 源 的 推荐 算法 的 时 候 就 需要 用 到 混合 推荐 。 

当然 ， 知 识 源 本 身 不 能 构成 推荐 系统 ， 因 为 一 个 人 工 智 能 系统 需要 算法 。 但 是 推荐 系 
统 难以 归纳 完全 ， 因 为 新 的 推荐 算法 总 是 以 极 强 的 形式 化 方法 给 出 的 。 不 过 ， 从 大 体 上 来 
说 ， 推 荐 系统 可 以 归纳 为 如 下 几 类 : 协同 过 滤 推 荐 系统 使 用 多 种 分 类 算法 为 了 解决 高 维 数 
据 空 间 高 度 稀 朴 的 情况 ， 基 于 内 容 的 推荐 系统 使 用 二 位 学 习 型 算法 ， 它 适用 于 低 维 数 据 空 
[B]; 基于 知识 的 推荐 系统 使 用 多 种 体系 的 推理 机 制 。 
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图 11.2 知识 源 和 推荐 类 型 


但 是 ， 一 种 算法 只 有 找 对 了 知识 源 才 能 发 挥 作用 。 如 何 找 对 知识 源 是 本 章 的 主题 。 通 过 总 
结 不 同 的 应 用 领域 以 及 不 同 的 用 户 交 互 方式 ， 我 们 可 以 得 出 不 同 知识 源 的 适用 范围 以 及 特征 。 
这 些 结论 反 过 来 也 可 以 作为 选择 合适 的 推荐 算法 的 指导 。 接 下 来 我 们 将 研究 领域 的 特点 。 


11.4 领域 


推荐 领域 是 推荐 系统 将 要 操作 的 一 组 物品 ， 也 包括 推荐 系统 想 要 支持 的 一 些 目的 和 手 
段 。 下面 举 一 个 针对 专门 的 推荐 系统 的 例子 ， 帮 助 政府 情报 分 析 员 鉴别 新 闻 报道 的 新 闻 推 . 
荐 系统 与 通用 新 闻 推荐 系统 ， 如 Google News， 在 实现 上 的 考虑 会 有 所 不 同 。 反 过 来 ， 领 
域 的 特点 影响 了 不 同 知 识 源 的 可 用 性 与 实用 性 。 以 在 线 新 闻 系 统 为 例 ， 不 是 一 小 部 分 而 是 
大 部 分 的 新 闻 用 户 没有 时 间 去 看 和 评论 。 更 进一步 ， 新 闻 本 身 也 经 常 发 生变 化 。 所 以 我 们 
可 以 归纳 出 这 样 一 条 结论 一 一 “ 社 群 /评价 /评分 ”知识 源 是 非常 稀疏 和 动态 的 。 

领域 的 另 一 个 方面 与 推荐 系统 所 植 人 的 广泛 应 用 有 关 。 如 果 推 荐 系统 只 是 一 个 大 系统 
的 一 部 分 ， 如 电子 商务 网 站 ， 那 么 推荐 系统 在 日 常用 户 交互 中 所 产生 的 影响 越 小 越 好 。 这 
也 许 会 限制 用 户 需求 收集 的 程度 。 从 另 一 个 方面 来 说 ， 如 果 推 荐 系统 是 用 户 所 使 用 的 主要 
应 用 ， 那 么 推荐 系统 可 以 更 直接 地 获得 用 户 数据 。 

我 们 发 现 了 实现 者 需要 考虑 的 有 关 领 域 的 6 大 重要 特征 ， 异 构 性 、 风 险 性 、 变 动 性 、 
交互 风格 、 偏 好 稳定 性 和 可 理解 性 。 ， 


11.4.1 异 构 性 


一 个 相同 性 质 ( 简 称 “ 同 质 ”) 的 物品 组 成 的 空间 包含 很 多 拥有 不 同 特征 的 物品 ， 而 且 ， 
最 重要 的 是 它们 可 以 满足 不 同 的 目标 。 举 例 来 说 ， 一 个 电子 商务 网 站 如 亚马逊 ， 拥有 大 量 
的 同 质 物品 需要 推荐 。 甚 至 在 图 书 这 样 一 个 简单 的 推荐 类 别 中 也 包含 诸多 不 同 的 类 别 ， 如 
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家 居 维 修 、 爱 情 小 说 、 厨 艺 、 童 话 故 事 等 ， 都 存储 在 同一 个 数据 库 中 。 

一 个 单一 性 的 推荐 空间 意味 着 ， 与 领域 相关 的 内 容 知识 将 可 以 更 方便 地 获取 与 维护 。 
考虑 这 样 的 情况 ， 一 个 仅 推荐 数码 相机 的 网 站 ， 而 与 之 相对 的 是 推荐 所 有 电子 产品 的 网 
站 。 数 码 相 机 网 站 将 会 有 足够 的 精力 去 使 用 摄影 方面 的 专业 知识 ， 但 是 通用 电子 商品 网 站 
将 会 面临 一 个 极 具 挑 战 性 的 任务 ， 为 了 给 所 有 电子 产品 消费 者 推荐 而 构建 一 个 知识 工程 。 
如 果 物 品 之 间 的 特点 变化 很 大 ， 那 么 即使 一 个 简单 的 关于 物品 的 特征 的 目录 也 很 难 设计 。 


11.4.2 风险 性 


推荐 领域 可 以 通过 在 用 户 产生 推荐 时 的 风险 程度 不 同 来 区 分 。 一 个 价值 99 美 分 的 音 
乐 专辑 的 风险 是 低 的 ,但 是 一 个 价值 150 万 美元 的 财产 所 有 权 或 者 医疗 诊断 的 风险 就 很 高 
了 。 风 险 性 决定 了 用 户 对 于 错误 推荐 的 忍耐 程度 。 在 某 些 领域 中 ， 错 误 的 负面 影响 可 能 会 
非常 显著 。 比 如 ， 在 一 些 选 择 中 可 能 会 存在 高 额 的 消费 和 高 风险 的 问题 。 

从 另 一 个 方面 来 考虑 风险 领域 ， 推 荐 系统 所 依赖 的 有 效 解决 方案 存在 很 多 约束 条 件 。 
举例 来 说 ， 一 个 房地产 购买 者 ， 对 于 地 理 位 置 、 价 格 、 舒 适度 有 很 高 的 约束 条 件 。 综 上 所 
述 ， 物 品 的 风险 度 越 高 ， 用 户 对 于 错误 的 容忍 度 就 越 低 。 


11.4.3 变动 性 


推荐 系统 应 用 在 这 样 的 一 些 领域 中 ， 要 推荐 的 物品 拥有 很 长 的 使 用 周期 ， 如 图 书 。 但 
是 有 时 推荐 系统 也 会 应 用 在 其 他 的 一 些 领域 当中 ， 待 推荐 物品 的 价值 和 相关 度 只 有 一 个 较 
小 的 使 用 周期 ， 如 新 闻 报 道 。 一 个 高 度 混杂 的 领域 是 由 于 内 部 构成 的 物品 经 常 发 生变 化 。 

在 这 样 的 领域 中 ， 推 荐 系统 面临 着 物品 需要 源源 不 断 地 被 整合 到 自身 的 数据 源 当中 的 
问题 。 因 此 极 大 地 增加 了 任何 种 类 的 选项 数据 的 稀 朴 性 ， 因 为 新 的 物品 必然 只 被 很 少 的 用 
户 查看 。 已 经 存在 了 一 段 时 间 的 物品 可 能 积累 了 一 些 评分 信息 ， 但 是 随 着 时 间 的 流逝 它们 
将 不 再 具有 相关 性 。 


11.4.4 交互 风格 


在 系统 中 ， 用 户 不 遗 余力 地 与 推荐 系统 进行 交互 ， 并 且 此 时 系统 从 用 户 不 明确 说 明 的 
偏好 中 挖掘 出 用 户 的 行为 。 例 如 ， 当 用 户 浏 览 网 站 的 时 候 ， 他 会 在 服务 器 上 留 下 一 些 浏览 
的 行为 记录 ， 而 这 些 记录 将 会 作为 推荐 的 依据 。 隐 含 的 输入 可 能 包括 用 户 正 在 浏览 的 特殊 
物品 、 用 户 的 交易 历史 、 流 逝 的 时 间 、 购 物 车 /消费 习惯 等 。 明 确 的 输入 包括 用 户 提出 一 
个 意见 或 者 请 求 或 者 将 个 人 信息 添加 到 系统 中 。 这 里 必须 有 一 些 用 户 能 感觉 到 的 好 处 才 可 
以 盖 过 这 样 做 的 用 户 代价 。 

隐 含 的 输入 天 然 就 存在 噪声 ， 因 为 它 来 自 对 用 户 行为 的 推断 。 虽 然 一 些 研究 人 员 已 经 可 以 
从 隐 含 输入 中 挖掘 出 偏好 甚至 领域 知识 L[58，72]， 但 是 隐 含 输入 还 是 只 适合 收集 简单 的 评分 知 
识 。 明 确 的 输入 可 能 会 造成 稀 朴 性 增加 ， 因 为 产生 这 些 输入 的 代价 会 使 得 用 户 很 少 这 样 做 。 


11.4.5 偏好 稳定 性 


用 户 的 偏好 依据 持续 时 间 的 不 同 会 有 变化 。 举 例 来 说 ， 一 个 购买 了 数码 相机 的 用 户 可 能 在 
购买 之 后 变换 他 的 偏好 ， 因 为 他 不 会 对 购买 完成 的 物品 再 产生 偏好 。 但 是 一 个 对 喜剧 电影 感 兴 
趣 的 用 户 可 能 希望 长 时 间 地 获得 喜剧 电影 的 推荐 。 当 然 ， 对 于 一 些 物 品 的 偏好 会 增加 也 会 随 着 
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时 间 训 减 。 举 例 来 说 ， 当 一 个 用 户 喜 欢 的 篮球 队 正在 参加 一 项 重大 的 赛事 ， 用 户 对 这 支 球 队 的 
兴趣 将 会 很 高 。 然 而 当 这 支 球 队 被 踢 出 局 或 者 比赛 结束 ， 用 户 的 兴趣 将 会 发 生 转移 。 

稳定 的 偏好 意味 着 过 去 收集 的 用 户 意见 数据 同样 适用 于 今天 。 因 此 使 用 该 数据 将 会 使 
获得 高 质量 的 知识 源 变 得 容易 。 不 稳定 的 偏好 数据 意味 着 过 去 被 收集 的 数据 可 能 大 打折 扣 
或 不 再 适用 。 这 就 使 得 搜集 当前 用 户 特定 需求 变 得 重要 。 如 果 用 户 在 一 个 会 话 周期 内 产生 
大 量 隐 语义 数据 ， 那 么 使 用 个 人 会 话 作 为 数据 文件 就 变 成 一 种 可 能 。 

用 户 偏好 不 稳定 的 问题 可 以 通过 收集 更 多 的 数据 来 改进 。 如 果 一 个 用 户 可 以 用 单个 会 
话 周 期 内 产生 足够 的 数据 去 代表 他 的 偏好 情况 ， 那 就 没有 必要 通过 历史 数据 挖掘 偏好 ， 并 
且 也 没有 必要 提高 用 户 偏 好 的 稳定 性 。 这 种 情况 在 网 络 的 一 些 个 性 化 应 用 中 很 常见 。 当 用 
户 浏览 网 站 会 产生 大 量 的 点 击 事件 时 ， 这 将 产生 足够 的 隐语 义 数 据 供 推荐 系统 使 用 。 


11.4.6 可 理解 性 


某 些 应 用 (举例 来 说 ， 通 常 具有 高 风险 ) 可 能 需要 系统 解释 它 的 推荐 。 比 如 ， 要 回答 这 
样 一 个 问题 “为 什么 要 推荐 这 个 物品 给 我 ?” 的 解释 增强 了 用 户 对 推荐 系统 的 信任 ,使 他 们 
认为 这 样 一 个 推荐 是 合适 的 [42]， 并 且 也 使 得 推荐 系统 更 容易 被 用 户 接受 。 

当 使 用 基于 内 容 的 知识 源 时 ， 解 释 推 荐 是 很 直接 的 。 解 释 基 于 社 群 知识 的 推荐 将 有 很 多 挑 
战 [41，57]。 请 参看 Herlocker 等 的 论文 [26]， 该 论文 阅 述 了 针对 一 些 可 选择 的 事物 的 评估 。 


11.5 知识 源 


如 同 我 们 上 面 所 阐述 的 那样 ， 领 域 的 选择 和 应 用 场所 的 特点 明确 地 限制 了 推荐 系统 所 
依赖 的 知识 源 的 种 类 。 相 应 地 ， 知 识 源 的 质量 和 可 用 性 影响 了 一 个 推荐 系统 可 以 有 效 利用 
的 推荐 技术 。 


11.5.1 社 群 知识 


社 群 知识 使 得 协同 过 滤 算法 使 用 用 户 的 邻居 的 偏好 推断 用 户 的 个 人 信息 来 进行 预测 成 
为 可 能 。 如 果 要 给 这 种 知识 建 模 ， 评 分 是 一 种 最 直接 的 数据 类 型 。 评 分 的 知识 常 被 描述 为 
—^ m iin WE. m 代表 的 是 用 户 数 ，n 代表 的 是 物品 数 。 每 一 个 与 之 相符 的 输入 项 
就 是 用 户 对 某 一 个 物品 的 评分 。 基 于 模型 的 技术 使 用 这 个 矩阵 提前 产生 模型 ， 然 而 基于 内 
存 的 技术 在 推荐 的 时 候 使 用 矩阵 产生 推荐 。 

使 用 其 他 类 型 的 用 户 意 见 数据 是 一 个 研究 热点 。 用 户 标签 是 意见 数据 的 主要 来 源 [49， 
23，69，40，68]。 在 这 种 情况 下 ， 数 据 将 主要 分 成 三 个 部 分 : 用 户 、 物 品 、 标 签 。 评 论 
形式 的 文本 数据 也 已 经 被 研究 [1]。 针 对 当前 的 协同 过 滤 推 荐 算法 ， 上 述 提 到 的 这 些 多 维 
数据 源 就 对 现 有 的 协同 过 滤 算 法 提出 了 挑战 [2]。 

在 异 构 的 领域 当中 ， 社 群 知识 应 作为 一 种 数据 源 ， 社 群 知识 的 采集 通过 用 户 的 输入 ， 
并 且 构 建 社 群 知识 不 需要 额外 的 知识 工程 。 然 而 ， 对 于 高 风险 领域 或 需要 进行 解释 的 领 
域 ， 社 群 知 识 不 够 精确 和 可 靠 。 

社 群 知识 将 会 变 得 越 来 越 稀 疏 并 且 异 构 性 越 来 越 强 。 对 于 高 变动 性 领域 ， 社 群 知识 会 
变 得 越 来 越 稀疏 。 在 物品 产生 消逝 变化 非常 快 的 情况 下 ， 指 定 的 任何 用 户 可 以 评论 指定 的 
任何 物品 的 概率 就 会 减 小 。 由 于 其 他 稀 朴 性 的 影响 ， 数 据 高 变动 性 的 问题 将 通过 大 量 用 户 
数量 来 改良 。 举 个 例子 ,谷歌 新 闻 可 以 通过 网 站 上 的 大 量 基础 活路 用户 使 用 协同 过 滤 进 行 
推荐 ， 甚 至 在 高 度 变动 的 新 闻 领 域 也 是 可 行 的 [16]。 
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对 隐 式 交互 类 型 的 领域 来 说 ， 采 用 社 群 知识 是 合适 的 ， 因 为 这 样 有 可 能 采用 协同 过 波 
中 机 器 学 习 和 统计 技术 的 经 典 算法 挖掘 用 户 行为 。 在 用 户 偏好 不 稳定 的 领域 ， 社 群 知识 可 
能 会 产生 误导 ， 因 为 历史 数据 都 是 不 可 信和 的。 


11.5.2. 个 大 知识 


对 于 推荐 系统 ， 个 人 知识 对 个 人 推荐 是 十 分 必要 的 。 

在 协同 过 滤 推 荐 中 ， 与 目标 用 户 的 个 性 化 知识 相 匹 配 的 是 来 自 整个 用 户 人 群 的 社 群 知 
识 。 针 对 个 人 最 直 白 的 一 种 说 法 是 ， 个 人 推荐 的 知识 源 都 是 相同 的 类 型 ， 并 且 都 需要 某 种 
相似 度 评判 标准 以 备 在 个 性 化 推荐 过 程 中 比较 个 体 差 异 。 但 是 研究 人 员 在 针对 个 人 推荐 的 
评分 工作 中 也 使 用 了 人 口 统 计 知识 。Krulwich[ 32] 使 用 通过 销售 调研 的 人 口 统计 组 数据 去 
产生 关于 一 系列 产品 和 服务 的 推荐 。 在 其 他 推荐 系统 中 ， 机 器 学 习 常 被 用 作对 于 基于 人 口 
统计 数据 的 分 类 器 的 训练 L52] 。 

在 异 构 领域 中 ， 把 用 户 的 输入 转换 成 确定 的 推荐 物品 是 困难 的 。 举 例 来 说 ， 两 个 对 于 
电影 有 相同 偏好 的 用 户 对 于 音乐 是 否 有 相同 偏好 是 不 确定 的 。 

在 缺少 社 群 知识 的 情况 下 ， 尤 其 是 与 评分 有 关 的 个 人 知识 可 以 和 与 物品 特征 有 关 的 内 容 知 
识 相 结合 ， 以 构造 一 个 使 用 有 监督 分 类 学 习 的 典型 的 基于 内 容 的 推荐 系统 [34，47，51]。 

如 果 是 一 个 需要 用 户 短期 需求 的 知识 的 领域 ,那么 某 类 基于 知识 的 推荐 系统 将 非常 适 
合 它 。 查 询 是 最 基本 的 请 求 输入 项 ， 通 常 包括 如 下 几 种 类 型 : 用 户 的 陈述 ， 任 何 形式 的 系 
统 的 接收 的 内 容 ， 以 及 用 户 正 在 搜索 的 内 容 。 由 于 约束 条 件 和 偏好 的 制约 ， 用 户 只 能 在 有 
限 的 情况 下 排列 他 们 的 选择 。 举 例 来 说 ， 一 条 狗 的 主人 在 租 住 公寓 的 时 候 必 须 考虑 公寓 能 
够 接受 他 的 宠物 。 有 和 孩子 的 父母 在 选择 公寓 的 时 候 通常 喜欢 靠近 公园 和 操场 。 在 有 高 风险 
和 需要 解释 的 推荐 领域 中 ， 通 常 需要 从 用 户 那 里 提取 需求 和 约束 条 件 。 同 样 ， 在 一 些 用 户 
偏好 不 确定 的 领域 中 用 户 的 需求 也 是 必需 的 ， 因 为 历史 数据 是 靠不住 的 。 

在 很 多 推荐 系统 中 ， 不 止 一 种 类 型 的 用 户 输入 项 被 使 用 。 比 如 ， 在 CBR 推荐 系统 中 
使 用 用 户 的 偏好 和 约束 [43]。 文 献 [15] 中 提 到 一 个 关于 偏好 发 现 的 启发 式 方法 。 


11.5.3 基于 内 容 的 知识 


最 基本 的 内 容 知识 是 物品 特征 ， 物 品 特征 的 数据 (例如 ， 一 些 数值 如 价格 或 者 象征 性 
的 标志 (举例 来 说 ， 像 目的 地 或 飞机 场 )) 可 以 通过 产品 数据 库 来 查找 。 这 些 特征 可 以 被 推 
荐 系统 所 使 用 。 当 然 实施 者 希望 可 以 约束 特征 空间 。 举 例 来 说 ， 一 部 电影 的 全 体 演 员 和 职 
员 表 可 以 作为 特征 数据 ， 但 是 也 会 伴随 很 多 稀 朴 的 特征 ， 它 们 的 利用 率 极 为 低下 。 如 果 整 
理 这 个 列表 挑选 出 最 佳 的 演员 、 最 佳 的 导演 、 最 佳 的 编剧 将 会 更 加 适用 。 

如 果 物 品 由 非 结构 性 的 文件 所 描述 ， 如 新 闻 报 道 ， 那 么 开发 者 将 使 用 信息 提取 技术 ( 匡 ) 去 
提取 用 户 在 推荐 过 程 中 的 选择 特征 。 标 准 化 技术 包括 敏感 词 排 除 、 抑 制 特征 空间 简化 等 。 通 过 
特征 选择 复杂 特征 的 技术 ， 如 信息 增益 、 交 互信 息 、 交 叉 焙 、 或 者 优势 率 [44]j， 特 征 可 以 被 进 “ 
一 步 消减 。 高 度 结构 化 的 文件 ， 如 HTML 页 面 ， 可 以 针对 特征 提取 提供 更 多 的 选择 。 在 文献 
[30] 中 论述 了 如 何 应 用 TE 技术 提取 结构 化 文件 或 半 结 构 化 文件 的 内 容 知 识 。 在 多 媒体 领域 中 内 
容 的 知识 是 一 个 新 的 挑战 。Hauptmann 在 文献 [22] 中 讨论 了 多 媒体 检索 技术 。Osmar 等 [71] 研 
究 了 多 媒体 的 数据 挖 气 ， 在 论文 中 阐述 了 针对 推荐 的 大 量 有 用 技术 。 

基于 内 容 的 推荐 算法 和 基于 知识 的 推荐 算法 所 做 出 的 推荐 质量 完全 取决 于 它们 所 依赖 的 用 
户 的 选择 的 内 容 数 据 的 质量 。 事 实 上 ， 缺 少 可 以 信赖 的 物品 特征 常常 被 认为 是 使 基于 内 容 的 推 
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荐 失效 的 主要 原因 。 创 造 并 维护 一 个 包含 有 用 的 物品 的 特征 信息 的 数据 库 的 开销 是 不 应 该 被 低 
估 的 ， 尤 其 是 在 混合 推荐 领域 中 。 举 例 来 说 ， 在 数码 相机 领域 或 手机 行业 ， 新 的 技术 革命 常常 
发 生 。 这 就 要 求 针对 每 一 个 物品 的 所 有 个 人 推荐 和 与 之 相关 的 计划 都 要 更 新 。 如 果 存 在 大 量 通 
过 多 种 渠道 提取 的 没有 完全 独立 的 特征 数据 ， 那 么 系统 将 承受 来 自 这 些 特征 数据 的 噪声 的 干扰 。 
从 另 一 个 角度 来 说 ， 有 高 风险 的 一 些 应 用 将 会 更 加 关注 如 何 获取 干净 的 特征 数据 。 总 而 言 之 ， 
解决 这 一 问题 需要 基于 人 工 复查 特征 数据 和 基于 人 工 的 标签 。 
11. 5. 3. 1 领域 知识 

基于 知识 的 推荐 系统 所 需要 知道 的 不 仅 是 物品 所 对 应 的 特征 。 推 荐 系统 所 能 使 用 的 最 基 
本 的 领域 知识 形式 是 物品 的 特征 实体 。 这 样 的 实体 使 得 推荐 系统 能 够 推测 出 更 深层 次 的 特征 
和 基本 特征 的 相同 或 区 别 。 举 例 来 说 ， 餐 厅 推 荐 系统 Entree[12] 有 包含 各 种 豪 饪 类 别 的 本 体 
知识 ， 并 可 以 做 出 这 样 的 一 个 推论 : 与 德国 餐馆 相 比 ， 泰 式 餐 馆 更 加 类 似 于 越南 餐馆 。 

很 多 高 风险 选择 给 该 领域 的 推荐 系统 强加 了 必须 遵守 的 限制 。 举 例 来 说 ， 一 个 理财 产 
品 的 推荐 系统 [19] 也 许 会 知道 特定 的 投资 设备 仅 适 合 于 拥有 特定 特征 的 用 户 ( 比 如 ， 对 年 
龄 超过 55 岁 的 人 来 说 一 项 特殊 的 生命 保险 政策 并 不 适合 他 们 )。 所 谓 推荐 的 问题 在 某 种 情 
况 下 可 以 被 完全 地 表述 为 如 下 形式 ， 即 将 用 户 和 系统 正在 提出 的 约束 进行 满足 的 过 程 。 

最 后 的 一 种 领域 知识 是 方法 -结果 知识 ， 这 种 知识 可 以 使 用 户 的 目标 (结果 ) 与 满足 用 
户 的 产品 (方法 ) 对 应 起 来 。 举 例 来 说 ， 一 个 要 买 相机 的 人 可 能 不 太 了 解 相 机 ， 但 是 他 知道 
他 要 在 他 女儿 进行 篮球 赛 时 给 她 拍照 片 。 用 户 从 推荐 系统 获 益 的 一 个 方面 是 : 他 们 可 以 做 
出 更 好 的 选择 而 不 用 熟悉 复杂 的 产品 空间 。 

表 11. 1 总 结 了 这 些 领 域 及 其 对 知识 源 的 影响 。 


表 11. 1 推荐 领域 对 于 知识 源 的 影响 
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解释 不 充分 必要 条 件 能 对 应 到 物品 















难以 设计 /维护 
有 领域 限制 




















需要 解释 可 以 用 到 领域 知识 





11.6 从 领域 到 技术 


在 讨论 推荐 系统 领域 之 前 需要 先 说 一 些 基 本 的 问题 。 首 先 ， 在 一 些 领 域 中 社 群 知识 不 
是 那么 好 用 ， 比 如 ， 高 风险 领域 和 高 变动 的 领域 。 在 高 变动 领域 中 ， 一 个 物品 可 能 没有 足 
够 时 间 在 被 其 他 物品 替换 掉 之 前 建立 起 在 大 量 用 户 中 的 声望 。 

当 存 在 与 领域 相关 的 巨大 风险 时 ， 除 了 其 他 用 户 喜 欢 这 个 物品 这 种 简单 理由 ， 大 部 分 
用 户 需要 对 合适 的 推荐 有 更 加 合理 的 解释 。 第 25 章 将 论述 关于 协同 过 滤 推 荐 系统 的 健壮 
性 。 如 果 我 们 优先 考虑 当前 的 上 下 文 环境 ， 那 么 通过 用 户 过 去 交互 记录 所 获得 的 用 户 信息 
也 就 不 那么 令 人 满意 了 。 

同样 ， 如 果 考察 交互 ， 那 么 我 们 会 发 现 从 每 种 类 型 的 交互 中 提取 知识 并 不 总 是 那么 容易 。 
在 推荐 系统 中 常常 包含 隐 式 的 输入 ， 所 以 我 们 很 难 直接 获取 用 户 的 需求 。( 如 同 Watson 系统 所 
做 的 工作 一 样 L8]， 有 时 我 们 可 以 通过 其 他 的 应 用 程序 从 用 户 的 交互 行为 中 提取 隐 式 需求 。》 
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解决 偏好 不 稳定 因素 常常 需要 基于 知识 的 推荐 技术 。 研 究 用 户 过 去 的 交互 行为 被 证 明 
是 一 种 妨害 而 不 是 帮助 。 然 而 ,一 些 特殊 的 情况 ， 如 网 站 个 性 化 推荐 系统 ， 用 户 在 一 个 会 
话 期 间 可 以 提供 大 量 的 隐 含 数据 。 这 可 以 使 我 们 能 够 组 织 成 有 效 的 文件 信息 与 其 他 用 户 的 
信息 进行 对 比 。 

表 11. 2 展示 了 不 同 领域 因素 在 推荐 方法 选择 上 的 影响 。 

现在 针对 具体 评判 选择 技术 的 标准 还 没有 一 个 明确 的 结论 ， 因 为 需要 我 们 注意 的 一 
点 是 不 同 的 技术 有 不 同 的 实现 方法 和 
不 同 的 维护 成 本 。 协 同 过 滤 推 荐 似乎 
是 一 种 最 小 的 开销 实现 方法 。 协 同 过 
滤 推 荐 仅仅 需要 一 个 用 户 评分 数据 组 
成 的 数据 库 ， 并 且 数 据 库 中 的 数据 也 
不 需要 很 干净 ， 物 品 的 特征 也 不 需要 
精心 设计 。 与 其 他 推荐 技术 相 比 ， 协 
同 过 滤 推 荐 的 要 求 最 少 。 基 于 知识 的 
推荐 系统 是 开销 最 大 的 一 种 方法 ， 因 
为 它 需 要 特定 的 知识 工程 和 持续 维护 。 
所 以 ， 开 发 者 希望 采用 与 领域 相 结合 
的 一 种 开销 最 小 的 解决 方案 。 

还 有 另外 的 一 种 考虑 就 是 采用 混合 
推荐 ， 它 融合 了 多 种 推荐 技术 。 举 例 来 说 ， 为 了 解决 混杂 数据 环境 下 偏好 不 稳定 的 问题 ， 
我 们 可 以 采用 混合 了 基于 内 容 的 推荐 和 协同 过 滤 推荐 的 方法 。 具 体内 容 请 参看 文献 [11]。 


11.6.1 算法 


如 果 已 经 能 够 明确 地 知道 以 什么 样 的 特征 为 标识 的 领域 适合 这 样 的 推荐 技术 或 另 一 种 
推荐 技术 ， 那 么 接 下 来 很 自然 的 一 个 问题 就 是 什么 样 的 算法 适合 推荐 。 完 全 讨论 这 个 问题 
已 经 超过 了 本 章 的 内 容 范围 ， 读 者 需要 回顾 相关 的 章节 。 但 是 就 协同 过 滤 推 荐 而 言 我 们 还 
是 可 以 提出 一 些 想法 的 。 

在 基于 用 户 的 协同 过 滤 推 荐 中 ， 根 据 活跃 用 户 相似 度 高 的 原则 选择 合适 的 用 户 群 。 在 
系统 运行 过 程 中 ， 使 用 加 权 的 评分 集合 预测 活跃 用 户 的 评分 状况 。 不 同 的 协同 过 滤 实 现 方 
式 使 用 不 同 的 改进 过 的 基于 领域 的 评分 预测 算法 。Herlocker 等 在 其 文章 "中 提出 了 一 种 
在 这 类 算法 中 关于 如 何 设计 选择 的 实验 分 析 ， 并 分 析 了 相似 度 和 矩阵 、 加 权 方 法 、 合 并 方法 
和 评分 标准 化 的 差异 。 

基于 物品 的 协同 过 滤 推 荐 是 一 种 基于 内 存 的 算法 ， 这 个 算法 研究 了 物品 之 间 的 关系 以 
及 用 户 是 如 何 评价 它们 的 。 基 于 物品 的 kNN 算法 被 证 明 与 基于 用 户 的 协同 过 滤 算 法 相 比 
可 以 产生 更 好 更 准确 的 推荐 ， 尤 其 是 在 大 的 物品 集合 中 [59]。 

基于 内 存 的 最 近邻 居 算 法 有 两 个 重要 的 计算 约束 : 规模 和 稀 朴 性 。 由 于 进行 平方 比较 时 需 
要 比较 每 个 用 户 和 其 他 用 户 的 区 别 ， 这 些 技术 在 大 用 户 集合 中 显得 没有 多 大 用 处 。 同 样 如 果 需 
要 直接 进行 比较 物品 的 评分 ， 这 意味 着 如 果 在 一 个 高 度 稀 朴 的 环境 下 用 户 将 有 很 少 的 邻居 。 

在 一 些 数 据 库 中 ， 过 度 稀疏 的 数据 空间 可 能 会 隐藏 稠密 数据 空间 下 的 真相 。 热 门 度 指 
数 曲线 使 得 采用 基于 内 存 的 技术 成 为 可 能 ， 因 为 它 可 以 发 现在 数据 稠密 子 空间 下 用 户 或 物 
品 之 间 的 一 致 性 ， 并 且 使 用 这 个 一 致 性 在 稀 朴 空间 对 用 户 进行 推荐 [27](Jester 在 他 的 文 


表 11.2 领域 因素 和 推荐 技术 
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章 中 [20] 提 出 构建 一 个 高 度 稠密 的 数据 空间 给 所 有 用 户 推荐 ) 。 

降 维 ( 降 维 的 方法 主要 有 : 奇异 值 分 解 、 隐 语义 分 析 或 者 其 他 的 一 些 技 术 ) 是 到 目前 为 
止 解决 评分 数据 稀 朴 的 一 种 标准 方式 L[60，74]。 各 种 形式 的 压缩 及 降 维 都 需要 严格 的 离线 
计算 。 通 过 这 样 的 一 个 过 程 数据 规模 就 得 到 了 优化 。 由 Netflix prize 提出 的 电影 评价 分 据 
也 被 用 在 2007 年 KDD 杯 数 据 挖 掘 大 赛 上 ， 这 个 电影 数据 集 就 是 一 个 经 典 的 高 度 稀 玻 的 大 
数据 集 。 这 激发 着 越 来 越 多 的 研究 团队 研究 新 的 基于 模型 的 算法 L56，33] 。 

这 里 还 有 其 他 的 基于 模型 的 协同 过 滤 算 法 ， 比 如 ， 一 些 机 器 学 习 技术 像 贝 叶 斯 网 L7] 
和 聚 类 分 析 [7，66]。 贝 叶 斯 网 络 适用 于 用 户 兴 趣 比较 稳定 的 领域 ， 因 为 用 户 兴趣 变化 组 
慢 就 给 构建 模型 提供 了 足够 的 时 间 。 

聚 类 分 析 算 法 依据 用 户 兴趣 将 用 户 分 成 不 同 的 组 。 一 旦 建立 好 了 一 个 徐 ， 那 么 对 于 个 体 的 
预测 就 可 以 根据 簇 中 群体 的 平均 值 给 出 [59]。 聚 类 技术 产生 的 推荐 与 其 他 技术 相 比 缺 少 人 性 化 ， 
并 且 在 有 些 时 候 聚 类 的 结果 要 低 于 近邻 算法 [71]。 聚 类 分 析 技术 可 以 用 在 消减 备 选用 户 数据 集 
的 第 一 步 ， 也 可 以 将 最 近邻 计算 的 结果 分 散在 不 同 的 推荐 引擎 中 。 然 而 ， 将 用 户 分 到 不 同 的 能 
中 降低 了 推荐 的 精确 度 ， 但 是 预 聚 类 是 一 种 可 以 权衡 准确 度 和 流行 度 的 方法 [59]。 


11.6.2 抽样 推荐 领域 


表 11. 3 阐述 了 这 些 评 判 标准 在 10 个 不 同 推荐 领域 中 的 应 用 。 并 非 上 面 讨论 过 的 6 个 
方面 都 涉及 ， 但 是 我 们 也 可 以 清楚 地 看 到 上 面 的 方法 还 是 相对 准确 的 。 高 风险 领域 导致 产 
生 了 基于 知识 的 推荐 ; 可 解读 推荐 也 是 一 种 好 的 预测 器 。 异 构 领 域 主要 依靠 协同 过 滤 推 
荐 。 当 我 们 以 高 变动 和 偏好 不 稳定 的 视角 去 看 待 网 页 推荐 的 时 候 会 有 一 点 对 立 ， 因 为 网 页 
推荐 主要 依靠 协同 过 滤 方 法 。 正 如 我 们 上 面 讨 论 过 的 ， 数 据 库 的 大 小 会 补偿 偏好 不 稳定 。 
此 外 推荐 系统 可 以 在 一 个 会 话 内 搜集 大 量 明确 的 用 户 偏好 数据 。 当 然 ， 如 果 蜡 构 性 很 高 ， 
那么 我 们 往往 偏向 使 用 社 群 知识 。 


表 11.3 推荐 系统 的 抽样 领域 
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本 章 主要 论述 了 推荐 系统 作为 智能 系统 所 需要 的 知识 源 。 理 解 推荐 方法 的 不 同 的 最 好 
方法 是 理解 推荐 算法 所 采用 的 知识 源 。 通 过 考虑 领域 特征 是 如 何 影响 知识 源 的 可 用 性 和 质 
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11.7 总 结 


量 的， 就 可 以 将 推荐 技术 和 领域 特征 联系 起 来 。 


我 们 已 经 测试 过 6 个 不 同 的 因素 : 异 构 性 、 风 险 性 、 变 动 性 、 偏 好 稳定 性 、 交 互 风格 
和 可 理解 性 。 这 些 因素 可 以 用 于 描述 不 同 领域 的 特征 并 且 使 特征 和 推荐 技术 对 应 。 这 些 评 
价 方式 在 某 些 现 有 系统 上 的 应 用 表明 ， 它 们 是 在 研究 和 应 用 领域 得 到 成 功 采 用 的 技术 的 晴 


雨 表 。 
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这 篇 论文 基于 Ramezani 女士 在 2007 年 夏天 于 IBM Watson 研究 中 心 的 工作 。 此 外 ， 


一 些 作 者 如 Lawrence Bergman、Rich Thompson 和 Bamshad Mobasher 等 修改 简化 了 本 文 
的 一 些 内 容 。 期 间 Bamshad Mobasher 在 2008 年 的 推荐 系统 与 协同 过 滤 智 能 用 户 交 互 大 会 


上 发 表 了 题 为 “Selecting and Applying Recommendation Technologies” 的 报告 。 
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摘要 ”技术 强化 学 习 (Technology Enhanced Learning，TEL) 引 在 设计 、 开 发 和 测试 
那些 支持 并 加 强 个 人 和 组 织 学 习 实践 的 社会 技术 创新 。 因 此 ， 该 应 用 领域 包括 了 一 般 情况 
下 的 各 种 形式 的 教学 和 学 习 活动 的 技术 支持 。 由 于 信息 检索 (搜索 相关 学 习 资 源 帮 助 老师 
或 学 生 ) 在 技术 强化 学 习 中 至 关 重 要 ， 而 推荐 系统 的 部 署 则 大 大 提升 了 这 一 过 程 的 趣味 性 。 
本 章 将 着 重 介绍 用 于 技术 强化 学 习 环境 的 推荐 系统 ， 同 时 ， 也 将 突出 其 不 同 于 其 他 应 用 领 
域 的 推荐 系统 的 一 些 特 性 。 


12.1 简介 


技术 强化 学 习 旨 在 设计 、 开 发 和 测试 那些 支持 并 加 强 个 人 与 组 织 学 习 实 践 的 社会 技术 
创新 。 因 此 ， 该 应 用 领域 包括 一 般 情况 下 各 种 形式 的 教学 和 学 习 活 动 的 技术 支持 。 由 于 信 
息 检索 (搜索 相关 学 习 资 源 帮 助 老师 或 学 生 ) 在 技术 强化 学 习 中 至 关 重 要 ， 而 推荐 系统 的 部 
署 则 大 大 提升 了 这 一 过 程 的 趣味 性 。 

在 任何 产品 多 样 性 急剧 增长 的 领域 ， 技 术 强 化 学 习 都 需要 做 到 能 够 更 好 地 找到 学 习 资 源 
(主要 是 数字 化 资源 ) 。 例 如 ， 在 过 去 的 几 年 间 里 ， 人 们 建立 了 众多 数字 化 学 习 资 源 库 [96]。 在 
美国 ， 突 出 的 例子 是 资源 库 ， 例 如 MERLOT(http:// www. merlot. org) 有 着 超过 20 000 种 学 习 资 
AKA 70 000 位 注册 用 户 )， 以 及 OER Commons www. oercommons. org) 有 着 大 约 18 000 
种 资源 。 在 欧洲 ， 比 较 典 型 的 是 “欧洲 校园 网 内 的 学 习 资 源 互 换 ”(http://lreforschools. 
eun. org)， 该 网 站 含有 超过 43 000 种 学 习 资 源 ， 这 些 资源 来 自 欧洲 和 其 他 地 区 25 个 不 同 
的 内 容 提供 商 。 除 学 习 内容 ， 学 习 资源 可 能 还 包括 学 习 路 径 ( 帮 助 他 们 寻找 适合 的 学 习 资 
源 ) 或 相关 的 学 习 同 伴 ( 与 其 一 起 学 习 ) 。 

在 众多 的 网 上 学 习 资 源 可 供 选择 的 情况 下 ， 考 虑 到 各 种 正式 和 非 正式 环境 下 与 这 些 
资源 互动 的 机 会 ， 技 术 强 化 学 习 系 统 中 的 所 有 用 户 群 将 会 很 快 从 这 些 庞 大 的 学 习 资 源 中 
确定 适合 他 们 的 学 习 资 源 。 因 此 ， 技 术 强 化 学 习 本 身 就 包含 推荐 系统 的 概念 。 最 近 有 关 
综合 该 领域 相关 研究 成 果 ， 并 推动 研究 人 员 关 注 相 似 课题 的 努力 是 “用 于 技术 强化 学 习 
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的 社会 信息 检索 (SIRTEL)” 的 年 度 研讨 会 系列 ， 并 作为 一 个 关于 “用 于 技术 强化 学 习 的 
社会 信息 检索 ”特殊 专刊 发 行 在 (数字 信息 期 刊 》 上 。 这 些 努 力 带 来 了 一 系列 有 趣 的 结果 ， 
.主要 包括 : 
。 大 量 的 推荐 系统 已 被 部 署 (或 正在 部 署 ) 在 技术 强化 学 习 环 境 中， 
。 技术 强化 学 习 推荐 系统 要 尝试 达到 的 信息 检索 目标 不 同 于 用 于 其 他 系统 (如 产品 推 
荐 系统 ) 的 推荐 系统 ; 
。 需要 确定 技术 强化 学 习 推 荐 系统 的 特性 ， 以 便 详 细 说 明 其 用 于 系统 设计 、 开 发 和 
评估 的 方法 。 
在 此 方向 内 ， 本 章 试图 介绍 用 于 技术 强化 学 习 环境 的 推荐 系统 部 署 的 相关 议题 ， 请 牢 
记 该 应 用 领域 的 主要 特性 。 本 章 主要 贡献 如 下 : 
。 讨论 推荐 系统 在 TEL 的 应 用 背景 ， 特 别 是 在 TEL 语 境 下 的 相关 特性 。 
。 考虑 TEL 环境 中 的 用 户 任务 支持 ， 以 及 如 何 将 他 们 同 用 于 其 他 推荐 系统 内 较 典 型 
的 用 户 任务 比较 。 
。 回顾 来 自 自 适应 教育 超 媒 体系 统 和 学 习 网 络 (LN) 概 念 的 相关 工作 。 
。 评估 当前 的 TEL 推荐 系统 开发 状态 。 
。 提供 关于 TEL 推荐 系统 大 概 的 特性 和 要 求 介绍 ， 为 教育 系统 的 进一步 应 用 和 研究 


12.2 背景 
12.2.1 TEL 作为 上 下 文 


TEL 涉及 教育 环境 中 产生 的 不 同类 型 的 数据 ， 这 通常 被 称 为 宏观 环境 [99]j。 这 个 概 
念 对 用 户 动作 可 能 具有 重大 影响 力 ， 这 些 宏观 环境 维度 下 的 例子 包括 规模 (如 教育 水 平 )， 
正式 和 非 正 式 的 学 习 ， 投 放 环 境 ， 不 同 的 用 户 角 色 。 教 育 水 平 的 例子 是 K-12 教育 、 高 等 
教育 (HE) 、 职 业 教 育 和 培训 (VET) 。 

学 习 的 正式 环境 ， 包 括 教育 机 构 ( 如 大 学 、 学 校 ) 提 供 的 学 习 课程 或 课程 框架 ， 具 有 高 
度 结构 化 的 特点 ， 通 向 一 个 特定 的 认证 和 领域 专家 来 保证 质量 。 这 通常 发 生 在 老师 指导 的 
环境 下 ， 在 现场 、 同 步 方 式 下 实现 人 机 互动 。 

非 正式 的 环境 ， 换 名 话说， 即 在 文献 中 描述 所 谓 的 终身 学 习 者 ， 没 有 参加 任何 正式 的 
学 习作 为 一 个 学 习 阶段 ， 负 责 自 己 的 学 习 节 奏 和 路 径 [17，64]。 这 个 学 习 过 程 很 大 程度 上 
依赖 个 人 的 偏好 或 者 通常 选择 自我 引导 [8]。 非 正式 学 习 的 资源 可 能 来 自 专 家 社区 、 工 作 
环境 、 培 训 、 甚 至 朋友 可 能 会 提供 的 机 会 和 非 正式 能 力 的 培养 。 

参与 TEL 的 特点 是 可 以 提供 混合 学 习 机 会 以 实现 纯粹 的 远程 教育 [71]。 混 合式 学 习 
结合 了 传统 的 面对面 的 学 习 与 以 电脑 辅助 教学 的 学 习 [36]。 远 程 教育 ， 换 名 话说， 能 在 任 
意 的 同步 或 异步 方法 下 交付 使 用 TEL 环境 。 传 统 上 ， 远 程 教育 更 接近 于 自学 和 与 学 习 材 
料 互动 ， 典 型 的 是 使 用 异步 的 方式 进行 [36]。 但 是 ， 实 时 媒体 流 和 虚拟 个 人 学 习 环境 已 经 

在 正式 的 教育 环境 中 促进 同步 远程 学 习 服务 的 发 展 。 
最 后 ， 在 TEL 中 可 以 找到 不 同 的 角色 和 和 需求。 老师 指 导 的 互动 和 学 习 者 指导 的 学 习 
过 程 之 间 是 有 区 别 的 。 这 会 对 TEL 环境 的 目标 用 户 产生 影响 。 尽 管 宏观 环境 对 解释 和 设 
计 的 影响 巨大 ， 但 方方面面 很 容易 达成 一 致 ， 而 且 相 对 容易 衡量 。 微 环境 则 是 一 个 比较 有 
争议 的 概念 ， 更 难以 衡量 。 但 是 宏观 环境 一 般 是 领域 特有 的 ， 而 微观 环境 的 概念 在 各 种 不 
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同 领域 都 存在 。 
12.2.2 TEL 推荐 的 目标 


推荐 系统 过 去 的 成 果 中 包括 许多 相关 的 用 户 任务 ， 这 使 得 推荐 系统 能 够 支持 在 一 些 特定 
的 上 下 文 相关 的 应 用 场景 ( 见 第 7 章 )。 更 具体 地 说 ，Herlocker 等 在 文献 [38] 中 将 热门 (或 不 
那么 热门 ) 的 用 户 任务 与 表 12. 1 中 包括 的 许多 特定 的 推荐 目标 联系 起 来 。 一 般 来 说 ， 大 多 数 
这 些 已 经 确定 的 目标 和 任务 在 TEL 推荐 系统 中 也 是 有 效 的 。 例 如 ， 在 支持 学 生 达 到 特定 学 
习 目 标的 推荐 系统 中 ,“ 在 文档 中 提供 注释 ”或 者 “推荐 学 习 资 源 的 序列 ”都 是 相关 的 任务 。 表 
12. 1 给 出 了 推荐 结果 如 何 支持 Herlocker 等 在 文献 [38] 中 发 现 所 有 任务 的 TEL 相关 活动 。 此 
外 ， 它 还 包括 有 关 任 何 额外 需求 的 点 评 ， 这 将 有 助 于 TEL 推荐 系统 的 开发 者 。 


表 12. 1 当前 推荐 系统 支持 的 用 户 任务 和 TEL 推荐 系统 的 需求 


me | manang TE 
T 当 用 户 执 行 比如 ， 预 测 网 比如 ， 预 测 课程 阅读 发 现 能 在 学 习 上 下 文 
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另 一 方面 ， 与 典型 的 物品 推荐 方案 比较 ， 有 几 个 关于 期 望 什么 学 习 类 型 的 特殊 细节 需 
要 考虑 ， 比 如 ， 学 习 新 的 知识 或 者 加 强 现存 知识 可 能 需要 不 同类 型 的 学 习 资料 。 这 反映 在 
表 12. 1 中 的 第 二 部 分 ， 带 有 用 户 任 务 的 例子 对 于 TEL 特别 值得 关注 。 同 样 ， 这 里 也 包括 
了 针对 TEL 推荐 系统 开发 者 的 任意 额外 需求 的 点 评 。 

除了 初始 任务 识别 ， 在 TEL 上 下 文 环境 中 的 推荐 有 许多 基于 丰富 教学 理论 和 模型 的 
细节 。 例 如 ， 对 于 没有 特定 领域 先 验 知识 的 学 习 者 ， 可 以 应 用 如 Vygotsky 的 “最 近 发 展 
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区 ”的 相关 教学 规则 ， 例 如 ,“ 推 荐 学 习 对 象 应 该 有 一 个 水 平 略 高 于 学 习 者 现 有 的 能 力 水 
平江 [102]。 不 同 于 购买 产品 ， 学 习 是 一 种 努力 ， 相 比 于 商业 交易 往往 需要 更 多 的 时 间 以 及 
相互 交流 。 在 达到 固定 时 间 后 学 习 者 很 少 达 到 最 终 状 态 。 不 同 于 购买 以 及 拥有 产品 ， 学 习 
者 会 获得 在 不 同 的 领域 不 同 层次 的 不 同 能 力 。 在 这 种 情况 下 ， 确 定 相 关 学 习 目 标 并 且 支 持 
学 习 者 获得 目标 是 重要 的 。 另 一 方面 ， 根 据 上 下 文 ， 一 些 特定 的 用 户 任务 可 优先 。 这 就 要 
求 推荐 的 时 间 跨 度 要 长 于 推荐 产品 之 一 或 者 是 相似 学 习 资 料 的 推荐 产品 ， 因 为 学 习 过 程 中 
心 任务 是 概述 和 重复 [68] 。 

对 于 以 教师 为 中 心 的 教学 环境 ， 需 要 支持 不 同 的 任务 。 这 些 任 务 包括 备课 相关 的 任务 ， 上 
一 节 课 (也 就 是 实际 教学 )， 以 及 评估 或 考核 相关 的 任务 。 例 如 ， 要 备 好 课 教 师 会 有 一 定 的 教育 
目标 ， 并 且 需 要 保证 授课 方法 适合 学 习 者 的 特征 (例如 ， 他 们 以 前 的 知识 )。 备 课 可 以 包括 各 种 
信息 寻求 任务 ， 如 寻找 内 容 来 调动 学 习 者 积极 性 ， 来 唤醒 现 有 知识 ， 来 阐述、 具体 化 和 描述 新 
概念 和 信息 。 可 以 使 用 不 同 的 教学 方法 来 授课 (无 论 是 否 支 持 TEL)， 其 有 效 性 是 根据 设 定 的 目 
标 来 评估 。TEL 推荐 系统 可 以 支持 一 个 或 多 个 任务 ， 产 生 多 种 推荐 目标 。 

此 ， 尽 管 先前 确定 的 用 户 任务 和 推荐 的 目标 可 以 在 一 个 TEL 中 被 认为 是 有 效 的 ， 

但 是 仍 有 一 些 特殊 性 和 复杂 性 。 这 意味 着 ， 将 一 个 推荐 系统 ， 从 现 有 的 (如 商业 ) 内 容 推荐 
系统 转化 到 TEL n Ce py avi ene 在 TEL 中 ， 定 义 推荐 目标 以 及 部 
署 推荐 系统 之 前 ， 应 该 仔细 分 析 目 标 用 户 和 他 们 支持 的 任务 是 否 应 该 被 执行 。 这 意味 着 
TEL M NER ey 例如 ， 一 个 典型 的 TEL 推荐 系统 可 以 在 各 种 学 习 资 
源 中 建议 一 些 可 供 选择 的 学 习 路 径 ， 不 管 是 以 顺序 学 习 序列 的 形式 ， 还 是 以 与 学 习 资 源 交 
互 的 体系 结构 的 形式 。 这 在 教育 学 上 是 一 件 有 意义 的 事情 ， 反 映 了 基于 用 户 精通 程度 、 特 
定 兴趣 和 意图 应 用 环境 的 个 人 学 习 目 的 和 目标 能 力 等 级 。 上 下 文 一 些 环境 变量 必须 考虑 ， 
如 用 户 属性 、 域 的 特点 以 及 提供 个 性 化 推荐 的 智能 方法 。 在 自 适 应 教育 超 媒 体系 统领 域 ， 
已 经 开展 了 大 量 有 关 这 些 主题 的 工作 。 


12.3 相关 工作 


Web 系统 往往 难以 满足 大 量 用 户 的 异 质 性 需求 ， 针 对 这 一 难题 ， 出 现 了 一 个 新 的 研究 
分 支 叫 作 自 适应 网 络 系统 (或 自 适 应 超 媒 体 )， 尝 试 让 Web 行为 与 目标 用 户 的 动机 、 任 务 、 
兴趣 及 其 他 用 户 感 兴趣 的 特征 相 适应 ， 来 克服 传统 中 “一刀切 ”做 法 中 存在 的 弊端 [12]。 自 
适应 系统 的 一 一 个 分 类 已 经 应 用 到 教育 领域， 称 作 <“ 自 适应 教育 超 媒 体 (AEH) 系 统 ”。 由 于 
AEH 系统 解决 了 与 TEL 推荐 系统 高 度 相关 的 一 些 问题 ， 本 节 会 对 相关 工作 作 简 要 概述 ， 
并 指出 其 与 TEL 推荐 系统 之 间 的 相同 点 与 不 同 点 。 


12.3.1 自 适 应 教育 超 媒体 


自 适应 网 络 系统 属于 用 户 - 自 适 软件 系统 类 别 [87]。Oppermann[73] 认 为 “可 以 根据 用 
户 需 求 自动 改变 自身 特征 ”的 系统 可 被 认为 是 具有 自 适 性 的 。 自 适应 系统 会 考虑 用 户 与 系 
统 之 间 交 互 的 方式 ， 并 相应 地 调整 界面 展示 或 系统 行为 [108]。Jameson[43] 补 充 了 一 个 重 
要 特征 : “用户 自 适 应 系统 是 一 种 交互 系统 ， BEST? al call 令 行 为 
具有 自 适 性 。” 

自 适应 系统 帮助 用 户 从 大 规模 的 信息 空间 中 寻找 相关 的 物品 。 基 本 包含 三 种 主要 的 自 
适应 技术 L12]: 自 适应 内 容 选 择 、 自 适应 导航 支持 、 自 适应 呈现 。 其 中 第 一 个 自 适 应 内 容 
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选择 技术 发 源 于 自 适 应 信息 检索 (IR) 领 域 [6]， 并 基于 搜索 来 获取 信息 。 当 用 户 查 询 某 些 
信息 时 ， 系 统 能 自动 选择 和 优先 与 之 关联 度 最 高 的 条 目 。 自 适应 导航 支持 由 自 适 应 超 媒体 
系统 [9] 引 进 ， 并 基于 浏览 来 获取 信息 。 当 用 户 由 一 个 条 目 导 向 另 一 个 条 目 时 ， 系 统 能 控 
制 链接 (如 隐藏 、 分 类 、 增 加 注释 )， 从 而 将 用 户 引 导 至 关联 度 更 高 的 信息 条 目 上 。 自 适应 
呈现 技术 来 自 智 能 系统 中 的 自 适应 解释 和 自 适 应 呈现 研究 [70，76]。 它 负责 呈现 信息 而 非 
信息 获取 。 当 用 户 访 问 一 个 特定 页 面 时 ， 系 统 能 自 适 性 地 呈现 其 内 容 。 

如 Brusilovsky[10j] 所 描述 的 ， 教 育 超 媒体 是 自 适 应 系统 最 先 应 用 的 领域 之 一 。 图 12. 1 展示 
的 是 一 个 自 适 应 教育 超 媒体 系统 层级 的 简化 结构 。 这 一 结构 包含 : 教育 内 容 ( 如 学 习 资 源 )、 领 
域 (领域 本 体 论 )、 用 户 ( 用 户 模型 ) 等 知识 的 呈现 和 组 织 层 ; 适应 机 制 和 规则 层 ;为 用 户 提供 运 
行 时 适应 结果 层 。1990 年 到 1996 年 间 一 些 自 适 性 教育 超 媒体 系统 率先 被 开发 出 来 ， 可 以 大 致 分 
为 两 种 研究 趋势 。 其 中 一 种 趋势 的 系统 由 智能 教学 系统 (ITS) 领 域 的 研究 者 开创 ， 尝 试 将 该 领域 
的 传统 学 生 建 模 和 该 领域 中 已 开发 的 自 适应 方法 拓展 到 具有 超 媒 体 成 分 的 ITS[14，34，77]。 
另 一 种 趋势 则 由 从 事 教 育 超 媒体 的 研究 者 开创 ， 试 图 使 这 一 系统 适用 于 学 生 个 体 [19，21，39， 
48]. AEH 研究 通常 遵循 自 顶 向 下 的 方法 ， 主 要 依赖 的 是 专业 知识 及 参与 ， 从 而 对 TEL 情境 变 
量 进 行 界 定 及 模型 化 。 例 如 ，CristeaL 18] 描 述 了 AEH 内 容 授权 时 一 些 需 要 专业 知识 的 任务 ， 首 
先 要 建立 来 源 ， 对 其 进行 标记 ， 将 其 与 已 知 领域 模型 结合 ; 然后， 建构 和 维护 数据 的 或 动态 的 
用 户 模型 ， 因 为 这 是 AEH 成 功 自 适 的 关键 。 总 之 ，AEH 中 大 部 分 用 户 相关 信息 (特征 化 的 需 
求 及 欲望 ) 需 要 在 内 容 生成 阶段 进行 编码 。 这 种 适用 于 正式 教育 环境 中 ， 此 时 的 情境 变量 往往 是 
已 知 的 ，AEH 研究 中 有 很 多 能 在 TEL 推荐 研究 中 用 到 (如 处 理学 习 者 和 领域 模型 )。 另 一 方面 ， 
在 非 正式 情境 下 ， 需 要 探索 对 专业 知识 需求 较 少 的 方法 。 





12.1 AEH 简化 结构 中 包含 的 通用 层 ( 文 献 [47]) 


12. 3.2 学 习 网 络 
另 一 研究 方向 中 ， 语 境 变量 可 以 从 用 户 贡献 的 内 容 中 提取 。 这 一 系统 的 分 类 包含 学 习 
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网 络 ， 能 连接 特定 领域 中 分 布 的 学 习 者 和 提供 者 [53，54]。 学 习 网 络 的 设计 与 发 展 均 是 高 
度 灵活 、 以 学 习 者 为 中 心 、 自 底 向 上 的 ， 要 胜 过 正式 课程 和 自 项 向 下 的 以 学 习 资 源 为 中 心 
的 模型 。 学 习 网 络 由 许多 学 习 者 和 其 他 关联 者 提供 的 学 习 活 动 组 成 。 每 一 个 用 户 在 任 一 时 
刻 都 可 以 添加 、 编 辑 、 删 除 或 评价 学 习 资 源 。 

学 习 网 络 的 概念 [54] 为 分 散在 各 地 的 终身 学 习 者 提供 了 方法 和 技术 设施 来 帮助 他 们 提 
升 个 人 能 力 ( 见 图 12. 2) 。 它 利用 了 Web 2.0 发 展 所 带 来 的 可 能 性 ， 展 现 了 网 络 化 知识 社 
会 中 学 习 的 新 趋势 。 学 习 网 络 是 以 学 习 者 为 中 心 的 ， 其 发 展 依赖 学 习 者 参与 ， 是 自 底 向 上 
的 结构 。 学 习 网 络 这 一 概念 的 核心 思想 是 涌现 (emergence)， 涌 现在 行为 个 体 和 资源 的 交 
互 系统 自行 组 织 形成 一 个 高 层级 行为 模式 的 过 程 中 出 现 L35，45，103]。 





a) 最 初 阶段 ， 第 一 个 学 习 者 可 能 的 学 习 活动 路 径 “” b) 高 级 阶段 ， 所 有 学 习 者 的 集体 行为 中 涌现 的 学 习 路 径 
图 12.2 学 习 网 络 的 进化 


我 们 可 以 想象 用 户 ( 如 学 习 者 ) 在 学 习 网 络 中 与 学 习 活 动 进 行 交 互 ， 而 这 个 过 程 是 被 记 
录 下 来 的 。 通 过 间接 测量 ， 如 时 间 及 学 习 结 果 ， 或 直接 测量 ， 如 用 户 提供 的 评分 和 标签 ， 
可 以 确定 一 个 学 习 网 络 中 最 易 达 成 或 者 最 受 欢迎 的 路 径 ( 如 [28，100])。 这 些 信 息 可 以 反 
馈 到 学 习 网 络 中 的 其 他 学 习 者 那里 ， 从 而 为 网 络 中 的 “学 习 者 群体 ”提供 集体 性 的 知识 。 大 
多 数学 习 环境 设计 是 自 顶 向 下 的 ， 因 为 很 多 时 候 其 结构 、 学 习 活动 、 学 习 流 程 由 教育 机 构 
预先 设 定好 ， 而 学 习 网 络 采用 Web 2.0 技术 ， 对 用 户 生 成 内 容 (UGC) 进 行 创 造 、 分 享 、 
评分 和 调整 。TEL 领域 里 ， 一 些 欧洲 的 项 目 采 用 了 这 些 从 底 向 上 的 知识 创造 与 分 享 方法 。 
欧盟 倡议 中 的 TENcompetence 项 目 建立 了 这 一 非 正式 学 习 网 络 [110]。 

混 聚 型 个 人 学 习 环 境 (MUPPLE)[109] 是 另 一 遵循 自 底 向 上 方式 形成 和 界定 语 境 变量 
的 系统 类 别 ， 首 先 出 现在 [62，63，109] 中 。iCamop 欧盟 倡议 强调 ， 通 过 营造 灵活 的 氛围 ， 
允许 学 习 者 针对 特定 学 习 活 动 打造 属于 个 人 的 环境 ， 从 而 将 Web 2.0 来 源 整合 进 MUP- 
PLE。MUPPLE 是 学 习 网 络 概 念 的 一 个 实例 ， 因 而 能 体现 出 其 部 分 特征 。 由 于 MUPPLE 
不 需要 学 生 有 教育 机 构 背 景 ， 专 注 的 是 学 习 者 需求 而 非 学 生 管理 或 者 评估 机 构 的 需求 ， 所 
以 也 能 支持 非 正式 学 习 。 学 习 者 不 需要 修 读 正式 的 课程 ， 也 不 会 得 到 关于 能 力 水 平 的 任何 
证 明文 件 。MUPPLE 的 一 个 通病 在 于 ， 由 短 时 框架 来 收集 的 数据 量 ， 及 其 非 结 构 化 的 收 
集 方式 ， 这 会 导致 用 户 和 领域 建 模 难 度 很 高 ， 同 时 也 不 够 结构 化 。 另 一 方面 看 ， 这 也 是 推 
荐 系统 中 探索 用 户 和 物品 交互 时 (如 确定 用 户 和 物品 相似 度 时 ) 的 常见 问题 。 
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12.3.3 ”相同 点 与 不 同 点 


许多 自 适 应 教育 超 媒 体 (AEH) 系 统 属于 正式 学 习 ( 如 [3，20，57])， 知 识 域 呈 分 散 
粒状 ， 因 而 能 为 学 习 者 提供 个 性 化 的 推荐 。 这 些 系 统 采用 了 类 似 元 数据 和 本 体 等 的 技术 
[16j] 来 对 关系 、 条 件 、 学 习 资 源 以 及 学 习 者 模型 的 依赖 度 进行 定义 。 它 们 大 多 用 在 封闭 
语料库 程序 上 ， 教 育 设计 者 可 以 用 语义 关系 对 这 些 程序 上 的 学 习 资源 进行 描述 ， 因 而 是 
一 种 正式 的 学 习 服 务 。 如 前 所 述 ， 在 正规 的 教育 场景 中 (如 大 学 ) ， 都 会 有 结构 良好 的 正 
式 关 系 ， 比 如 ， 预 先 设置 好 对 应 的 地 点 、 学 生 / 老 师资 料 ， 以 及 检验 程序 的 学 习 计 划 ( 课 
程 表 )。 所 有 这 些 元 数据 都 可 以 用 于 课程 推荐 ,或 者 通过 对 学 生 进行 学 习 资 源 或 学 习 环 
境 的 适 配 来 达到 个 性 化 学 习 的 目的 [5]。 该 领域 一 个 有 意思 的 研究 方向 是 自 适应 排序 ， 
即 在 对 学 习 资源 进行 排序 时 ， 会 考虑 个 体 特征 和 偏好 等 因素 [47]。AEH 中 ， 在 运行 时 
及 学 习 系 统 维护 时 ， 存 在 大 量 的 设计 活动 。 此 外 ， 学 习 环 境 中 的 领域 需要 进行 详细 描 
述 。 这 些 方面 ， 使 得 自 适应 排序 和 其 他 自 适 应 超 媒体 在 TEL 推荐 中 对 技术 要 求 非常 高 。 

当 没 有 呈现 出 高 度 结构 化 的 域 模型 时 会 出 现 非 正式 的 学 习 网 络 。 为 了 创建 用 户 或 者 领 
域 模型 ， 需 要 用 到 挖掘 技术 。 比 如 ， 在 非 正式 学 习 中 ， 用 户 的 先 验 知识 是 一 个 非常 分 散 的 
参数 ， 因 为 它 完 全 依赖 于 用 户 提 供 的 没有 任何 标准 化 的 数据 。 在 处 理 先 验 知识 动态 且 分 散 
的 特性 ， 以 及 填补 知识 域 模型 的 缺失 方面 ， 类 似 隐 性 语义 分 析 的 概率 统计 技术 具有 很 好 的 
前 景 L97]。 非 正式 学 习 中 维护 和 结构 的 缺失 ， 也 称 为 “开放 语 料 问题 ”。 在 给 定 了 无 限制 数 
量 的 文档 不 能 手动 结构 化 ， 且 不 能 由 领域 概念 和 社区 元 数据 索引 [16] 时 ， 即 出 现 开放 语 料 
问题 。 因 此 ， 如 协同 过 滤 等 自 底 向 上 的 推荐 技术 更 为 合适 ， 因 其 几乎 不 需要 任何 维护 ， 而 
且 可 以 通过 社区 中 的 突现 行为 提升 推荐 表现 。Drachsler 等 [25] 分 析 了 在 学 习 网 络 中 ， 不 
同 种 类 的 协同 过 滤 技 术 是 如 何 帮 助 学 习 者 的 。 根 据 其 结论 ， 为 了 给 推荐 系统 提供 合适 的 导 
航 支 持 ， 我 们 必须 对 非 正 式 学 习 中 不 同 的 环境 条 件 ， 如 维护 缺失 、 学 习 对 象 分 散 等 因素 加 
以 考虑 。 学 习 网 络 主要 基于 用 户 生 成 信息 和 交互 来 构建 。 

除了 提 到 的 非 正式 学 习 中 先 验 知识 这 点 不 同 ， 从 环境 条 件 中 得 到 的 数据 集 也 存在 差 
异 。 一 般 来 说 ,与 需要 预测 的 评分 数量 相 比 ， 从 推荐 系统 中 得 到 的 评分 数量 非常 小 。 基 于 
小 规模 打分 的 有 效 预测 ， 对 推荐 系统 非常 重要 ， 且 能 影响 对 特定 推荐 技术 的 选择 。 正 式 学 
习 可 以 依赖 多 领域 专家 或 者 基于 多 重 准 则 的 学 生 的 常规 性 评估 (如 教育 质量 、 技 术 质量 、 
易 用 性 )[67]， 而 在 非 正式 学 习 中 ， 这 些 评估 程序 却 少 之 又 少 ， 且 为 非 结构 化 。 正 式 学 习 
环境 ， 如 大 学 ， 经 常 整合 评估 流程 来 进行 常规 的 质量 评价 ， 汇 报 给 资助 机 构 ， 在 这 种 整合 
的 评估 流程 之 下 ， 数 据 集会 更 加 密集 。 总 而 言 之 ， 在 非 正式 学 习 情 境 中 ， 数 据 集 的 特点 是 
由 评分 数量 稀少 而 导致 的 “稀疏 性 问题 ”。 非 正式 学 习 中 运用 多 标准 评分 ( 见 第 24 章 ) 可 以 
帮助 克服 这 一 问题 ， 这 些 多 标准 评分 对 学 习 者 社区 来 说 必须 是 合理 的 。 社 群 能 够 在 多 个 层 
面 上 给 学 习 资 源 打分 ， 如 所 要 求 的 先 验 知识 水 平 ( 从 新 手 到 专家 )、 学 习 资源 的 展示 风格 ， 
甚至 吸引 力 水 平 ， 因 为 让 学 生 满 意 且 有 动力 学 习 ， 是 非 正 式 学 习 中 一 个 至 关 重 要 的 标准 。 
这 些 明确 的 评分 程序 还 须 辅 以 间接 测量 指标 ， 如 使 用 “学 习 资 源 的 用 户 数量 ”"、“ 学 习 资 源 
所 进行 的 调整 数量 ”来 评估 学 习 资 源 的 时 效 性 。 

因而 ， 非 正式 学 习 与 正式 学 习 这 样 结构 完善 的 领域 在 多 方面 存在 着 差异 。 非 正式 学 习 
的 推荐 系统 可 能 会 没有 官方 机 构 维 护 ， 大 多 依赖 于 社区 ， 也 没有 界定 明确 的 元 数据 结构 。 
另外 ， 与 正式 学 习 自 顶 向 下 的 设计 且 建 立 学 习 服 务 ( 封 闭 语 料 库 ) 不 同 ， 非 正式 学 习 是 从 社 
区 (开放 语料库 ) 中 自 底 向 上 涌现 的 。 因 而 ， 将 推荐 系统 从 正式 场景 转移 并 应 用 到 非 正 式 场 
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景 下 会 很 困难 (反之 亦 然 )， 因 为 二 者 在 用 户 任务 和 推荐 目的 上 往往 具有 本 质 差异 。 
Drachsler 等 [24] 根 据 在 TEL 中 适用 性 和 有 用 性 为 推荐 技术 给 出 重要 评价 ， 其 简 述 如 

表 12.2。 该 表 总 结 了 每 一 种 技术 的 优 缺 点 ， 以 及 在 TEL 推荐 中 设想 的 有 用 性 。 然 而 ， 它 

的 目的 只 是 作为 讨论 的 基础 ， 未 来 还 会 有 对 已 有 推荐 方法 和 技术 的 更 具体 精确 的 调查 。 


# 12.2 Drachsler 等 发 明 的 推荐 技术 及 其 对 TEL 的 有 用 性 [24] 
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12.4 TEL 推荐 系统 调查 


TEL 领域 引入 了 若干 推荐 系统 向 用 户 提供 学 习 资源 。 因 线 上 发 布 的 学 习 资 源 种 类 非 
常 多 样 ， 且 辅导 者 和 学 习 者 合作 带 来 益处 ， 这 些 系 统 在 这 一 过 程 有 可 能 起 到 重要 的 教育 性 


作用 [81，82，59]。 接 下 来 将 回顾 近期 提出 的 一 些 方法 ， 并 对 它们 的 发 展 和 评估 状态 进行 
点 评 ， 见 表 12. 3。 
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表 12.3 文献 中 报告 已 实行 的 TEL 推荐 系统 
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最 先 为 学 习 资 源 建 立 的 协同 过 滤 系 统 是 Altered Vista 系统 [81，82，83]。 这 一 研究 
的 目的 在 于 探索 如 何 收集 用 户 对 学 习 资 源 的 评估 ， 然 后 促使 他 们 对 资源 质量 进行 口头 传 
播 。 该 研究 团队 同时 也 对 一 些 相关 问题 进行 了 探究 ， 如 界面 设计 L82]， 建 立 无 授权 元 数据 
来 存储 用 户 评价 [81]， 系 统 设 计 和 系统 所 用 评价 框架 [83]， 以 及 使 用 系统 来 给 社区 成 员 推 
荐 有 趣 的 资源 、 推 荐 喜好 和 观念 相近 的 人 等 预测 试 及 实证 研究 [83，104] 。 

另 一 用 于 学 习 资 源 推荐 的 系统 是 RACOFI( 规 则 应 用 协同 过 滤 ) 设 计 者 系统 L2，60， 
61]. RACOFI 结合 了 两 种 推荐 方法 : 基于 用 户 评分 的 协同 过 滤 引 擎 及 参照 规则 引擎 ， 其 
中 参照 规则 引擎 负责 挖掘 学 习 资源 之 间 存 在 的 关联 ， 并 将 这 些 关联 规则 用 于 物品 推荐 。 
RACOFI 研究 还 无 法 评估 推荐 系统 在 教育 方面 的 价值 ， 也 不 输出 用 户 对 系统 的 评估 结果 。 
RACOFI 技术 现 已 应 用 到 一 家 商业 网 站 inDiscover(http; //indiscover. net) 的 音乐 唱片 推荐 
上 。 此 外 ， 有 研究 者 报告 称 在 其 系统 中 也 采用 了 RACOFI 的 方法 [32j]。 

Rafaeli 等 创办 了 用 于 学 习 资 源 分 享 、 评 估 和 推荐 的 QSIA( 问 题 分 享 与 交互 作业 )[78， 
79]。 这 一 系统 目前 被 应 用 在 线 社区 情境 中 ， 目 的 是 对 学 习 活 动 中 的 社会 性 元 素 加 以 利用 ， 
促进 合作 和 在 线 推荐 ， 进 一 步 形 成 学 习 者 社区 。Rafaeli 等 没有 建立 一 个 典型 的 自动 化 推荐 
系统 ， 而 是 选择 主要 为 用 户 控 制 的 推荐 程序 作为 QSIA 的 基础 。 也 就 是 说 ， 用 户 可 以 自行 
决定 是 否 对 推荐 建议 来 源 ( 好 友 ) 进 行 控 制 ， 或 者 是 否 使 用 一 个 协同 过 滤 服 务 。 系 统 已 经 应 
用 在 一 些 如 职员 、 有 助教、 高 中 老师 和 学 生 之 间 的 知识 分 享 的 学 习 情 景 中 ,但 目前 还 没有 技 
露 其 评估 结果 [78，79] 。 

学 习 资 源 协 同 过 滤 的 这 一 流派 系统 中 ，CYCLADES 系统 [4] 构 建 的 环境 让 用 户 可 以 
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搜索 、 获 取 并 评价 OAI 储备 库 中 的 数字 资源 (OAI， 开 放 存 档 倡 议 ，http:Wwww. open- 
archives. org) 。OAI 是 几 家 电子 内 容 提 供 商 为 了 降低 互通 成 本 而 达成 的 非 正式 协议 ， 
而 ， 这 一 系统 可 以 推荐 不 同 存档 中 的 内 容 ， 并 可 以 通过 一 个 开放 的 框架 获取 资源 。CY- 
CLADES 推荐 评估 测试 由 60 个 用 户 进 行 预测 试 获 得 ， 主 要 测试 几 种 协同 过 滤 算法 的 
表现 。 

相关 的 系统 有 CoFind 原型 [29，30]， 同 样 也 使 用 网 络 免费 数字 资源 ， 但 使 用 的 是 一 
个 用 大 众 分 类 (标签 ) 方 法 来 进行 推荐 的 新 方法 。CoFind 的 开发 者 认为 基于 偏好 的 预测 并 
不 适用 于 学 习 情 境 ， 因 而 ， 像 大 众 分 类 这 种 由 用 户 驱 动 自 底 向 上 的 分 类 更 重要 。 

Manouselis 等 [67] 采 用 了 典型 的 基于 邻 域 集 的 协同 过 滤 算 法 来 实现 学 习 目 标 推荐 。 这 
一 研究 的 创新 之 处 在 于 ， 其 中 包含 的 算法 是 多 属性 的 ， 允 许 推荐 服务 将 用 户 对 学 习 资 源 的 
多 维度 评分 考虑 进去 。 该 研究 一 个 有 趣 的 结果 是 ， 与 使 用 同 种 算法 的 初始 实验 相 比 (如 
[65])， 相 同 的 算法 其 表现 却 是 变化 的 ， 这 种 变化 取决 于 测试 的 情境 。 例如， 相同 算法 在 
电子 商务 [65] 和 TEL 对 比 研究 [67] 的 结果 ， 会 引起 备 选集 合 的 不 同 算法 选择 。 这 可 能 暗 
示 着 在 一 个 情境 中 (如 电影 推荐 ) 表 现 良好 的 推荐 算法 在 另 一 情境 中 (如 TEL) 并 不 一 定 具 
有 同样 的 表现 ， 这 一 领域 还 需要 更 深入 的 实验 ( 见 第 7 章 )。 

Shen 和 Shen[88] 采 用 了 另 一 种 学 习 资 源 推 荐 方法 ， 他 们 建立 的 针对 学 习 目 标的 推荐 
系统 以 排序 规则 为 基础 ， 能 为 用 户 提 供 主题 的 本 体 概 念 方面 的 指导 。 在 确定 学 习 者 之 间 能 
力 差 距 后 ， 规 则 被 解除 ， 从 而 向 学 习 者 推荐 合适 的 资源 。 网 络 教育 学 院 的 学 生 会 对 其 进行 
预测 试 ， 反 馈 其 对 系统 的 看 法 。 

Huang 等 [41] 引 和 信 了 类 似 的 排序 系统 。 它 使 用 Markov 链 式 模型 来 计算 已 排序 课程 中 
学 习 目 标的 转换 概率 。 这 一 模型 采用 箭 值 法 来 发 现 一 条 或 者 多 条 推荐 的 学 习 路 径 。 预 测试 
在 一 所 大 学 实行 ， 一 共有 150 名 用 户 参 与 。 

Tang 和 McCalla 提出 了 一 个 进化 的 在 线 学 习 系 统一 一 面向 网 上 的 新 的 学 习 资 源 ， 其 
中 采用 了 混合 的 推荐 服务 [89，90，91，92，93]。 该 系统 主要 用 于 大 学 学 生 及 行业 从 业 人 
员 之 间 存 储 、 分 享 研究 论文 及 术语 。 根 据 资 源 的 内 容 和 技术 方面 来 描述 (标记 ) 资 源 ， 但 同 
时 学 习 者 也 需要 通过 打分 来 给 予 反馈 。 推 荐 系统 实现 包含 聚 类 模块 (使 用 数据 聚 类 技术 将 
兴趣 相近 的 用 户 归 类 ) 和 协同 过 滤 模 块 (使 用 经 典 的 协同 过 滤 技 术 ， 根 据 相 似 兴 趣 确定 用 户 
所 属 类 别 )。 作 者 对 几 种 技术 进行 研究 来 帮助 提高 系统 表现 ， 如 运用 虚拟 (仿真 ) 用 户 等 
[93]j。 同 时 也 通过 真实 用 户 对 系统 进行 评估 [94] 。 

Janssen 等 L44] 提 出 了 一 个 相当 简单 的 推荐 系统 ， 这 一 系统 不 考虑 任何 学 习 者 偏好 或 
者 用 户 个 人 信息 。 但 他 们 做 了 一 个 大 规模 的 包含 控制 组 和 实验 组 的 实验 ， 发 现 与 控制 组 相 
比 ， 实 验 组 在 有 效 性 (完成 学 习 目 标的 比例 ) 上 的 正 向 影响 在 效率 (完成 学 习 所 花费 的 时 间 ) 
上 并 不 显著 。 

Nadolski 等 [72] 为 不 同 推荐 算法 组 成 的 混合 推荐 系统 创建 了 一 个 仿真 环境 ,目的 是 对 
比 他 们 之 间 在 非 正式 学 习 网 络 中 对 学 习 者 的 影响 。 他 们 基于 轻 量 协同 过 滤 的 推荐 策略 对 比 
了 不 同 的 成 本 集约 本 体 ， 从 而 设立 了 实验 组 模拟 不 同 种 推荐 技术 组 合 。Nadolski 等 的 文献 
[724] 检 测 了 哪 种 推荐 策略 对 学 习 者 来 说 最 为 有 效 。 研 究 表明 ， 轻 型 协同 过 滤 推荐 策略 的 推 
荐 结果 并 不 如 本 体 推荐 策略 准确 ， 但 考虑 到 非 正 式 学 习 网 络 中 缺乏 维护 等 的 一 些 背景 ， 这 
种 策略 还 是 有 价值 的 。 这 一 研究 也 证 实 了 ， 与 没有 推荐 系统 的 情况 相 比 ， 推 荐 系统 能 让 用 
户 更 有 效 、 更 快捷 、 更 满意 地 达到 目的 。 研 究 还 显示 ， 包 含 评分 机 制 的 轻 量 协同 过 波 推 荐 
技术 可 以 作为 维护 密集 、 自 顶 向 下 本 体 推荐 策略 的 一 个 良好 的 替代 方案 。 
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ISIS 系统 采用 了 Hummel 等 [42] 近 期 提出 的 一 种 混合 的 学 习 资 源 推荐 方案 。 作 者 在 
Koper[52] 的 模拟 研究 之 上 ， 提 出 结合 了 基于 社交 (使 用 其 他 学 习 者 的 数据 ) 和 信息 (学 习 者 
个 人 信息 和 活动 的 元 数据 ) 的 混合 推荐 系统 ， 同 时 设计 了 一 个 针对 真实 用 户 的 实验 。Dr- 
achsler 等 [28j 最 近 报 告 了 ISIS 实验 的 结果 ， 发 现在 四 个 月 的 运行 时 间 后 ， 系 统 对 学 习 者 
效率 (完成 学 习 所 花费 的 时 间 ) 存 在 显著 影响 。 这 是 呈现 学 习 者 用 户 个 人 信息 和 活动 的 一 个 
很 好 的 范例 ， 这 一 应 用 是 学 习 领 域 里 的 潮流 方向 。 

这 一 研究 团队 最 近 开 发 了 ReMashed 推荐 系统 L26，27]， 关 注 的 是 非 正式 学 习 网 络 中 
的 学 习 者 。 他 们 建立 了 一 个 混 聚 环境 ， 组 合 了 不 同 Web 2.0 服务 ， 如 Flickr, Deli- 
cious. com, Slideshare. com 等 的 用 户 源 。 同 时 再 一 次 采用 了 混合 式 推荐 系统 ， 利 用 了 不 同 
Web 2.0 来 源 的 标签 和 打分 数据 。 之 所 以 采用 已 有 的 Web 2. 0 网 站 上 的 标签 是 为 了 解决 推 
荐 系统 中 常见 的 冷 启动 问题 ( 见 第 19 章 ) ReMashed 的 用 户 可 以 对 系统 中 所 有 用 户 数据 进 
行 打分 ， 这 些 评分 被 用 到 基于 Duine 预测 引擎 的 经 典 协同 过 滤 推 荐 上 [98]。 

类 似 的 方法 还 有 学 习 目 标 推荐 模型 (LORM) ， 它 同样 采用 混合 推荐 算法 的 方法 ， 从 多 
属性 描述 资源 ， 但 目前 还 没有 报告 称 应 用 在 实际 的 系统 中 [95] 。 

在 CourseRank £ Zt (http: //courserank. stanford. edu/CourseRank/main) 中 也 采用 了 
混合 推荐 法 ， 作 为 斯 坦 福 学 生 的 非 官方 选课 指南 。 在 这 个 系统 中 ， 推 荐 过 程 被 视 为 从 课程 
和 学 生 信 息 的 关系 数据 库 进 行 查询 的 过 程 [55]。 为 此 ， 需 要 界定 一 些 数 组 操作 ， 让 系统 为 
其 用 户 提 供 灵活 的 推荐 。 该 系统 最 早 于 2007 年 9 月 投入 使 用 ， 引 起 了 用 户 的 极 大 兴趣 ， 
据 报告 70% 的 斯 坦 福 学 生 都 使 用 了 这 一 系统 L56] 。 

Tunis 虚拟 大 学 (RPL ¥G, http: //cours. uvt. rnu. tn/rpl/) 课 程 储 备 库 的 原型 系统 中 
也 用 到 了 这 一 混合 方法 。 原 型 里 包含 的 推荐 引擎 ， 运 用 了 协同 过 滤 和 内 容 过 滤 的 算法 组 
合 ， 使 用 的 是 用 户 行为 日 志 记 录 和 挖掘 得 到 的 数据 。RPL 平台 上 的 使 用 日 志 也 用 于 这 一 目 
的 ， 目 前 已 经 开展 了 初级 评估 实验 [49] 。 

最 后 ， 还 有 一 些 系 统 或 算法 提议 可 被 用 于 支持 学 习 资 源 的 推荐 ， 包 括 许 多 半成品 系 
统 ， 如 Gomez-Albarran 和 Jimenez-Diaz[33] 的 案例 推理 推荐 系统 、 为 大 型 机 构 雇员 提供 服 
务 的 APOSDLE EU ih (http://www. aposdle. tugraz. at) 知识 分 享 环 境 中 的 情境 推荐 系 
统 [1]、A2M 原型 [86] 等 。 也 有 相关 研究 关注 多 媒体 学 习 资 源 推 荐 在 手机 、 掌 上 电脑 等 移 
动 设备 的 延伸 [51j。 

尽管 有 越 来 越 多 的 系统 应 用 到 学 习 资 源 推荐 ,对 其 发 展 和 评估 的 进 一 _ 步 探究 则 发 现 ， 
在 现实 应 用 背景 下 的 评估 研究 缺少 系统 性 。 如 表 12. 3 Hm: 

。 提出 的 大 多 数 系统 (20 个 中 有 12 个 ) 仍 然 在 设计 或 原型 阶段 ; 

。 MA 10 个 系统 进行 了 真实 用 户 实验 评估 。 

另 一 有 趣 的 发 现 是 ， 目 前 并 没有 针对 推荐 算法 的 实验 调查 ， 而 这 种 评估 在 其 他 领域 系 
统 检测 中 很 常见 (如 [7，22，37，74]) 。 因 为 在 一 个 推荐 系统 最 终 应 用 到 实际 场景 中 之 前 ， 
必须 要 进行 仔细 的 检验 并 将 算法 参数 化 ( 见 第 8 章 和 第 10 章 )。 这 样 做 的 主要 原因 是 ， 推 
荐 算法 表现 依赖 于 特定 的 应 用 场景 ， 因 而 建议 在 实际 应 用 前 ， 先 对 多 种 推荐 系统 的 设计 选 
择 进 行 实验 性 分 析 。 


12.5 TEL 推荐 系统 的 评估 


Worthen 等 [111] 将 评估 定义 为 “对 标准 进行 界定 、 说 明 、 应 用 来 决定 评估 目标 的 价 
值 、 质 量 、 效 用 、 有 效 性 、 或 者 在 这 些 标 准 上 的 重要 性 ”。 对 交互 系统 的 评估 可 以 确保 其 
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表现 符合 设计 者 期 望 ， 且 能 满足 用 户 需求 [23]。 对 推荐 系统 整体 而 言 ， 尤 其 是 TEL 推荐 
系统 ， 评 估 已 经 成 为 系统 成 长 和 成 功 生 命 周期 中 的 关键 节点 。 尽 管 在 评估 中 用 户 相关 评估 
方法 的 重要 性 被 一 再 强调 (参见 [38，69] 和 第 8 章 ) ， 然 而 时 至 今日 ， 推 荐 系统 评估 仍 注重 
那些 来 自信 息 获取 研究 中 的 非常 “技术 性 ”的 测量 方法 。 教 育 场景 存在 的 特殊 性 ， 使 得 
TEL 推荐 系统 评估 要 求 非常 高 。 为 此 ， 我 们 尝试 在 本 章 采用 不 同 的 视角 来 总 结 相关 的 评 
HER. 


12.5.1 对 组 件 的 评估 


AEH 系统 评估 常 被 认为 难度 较 高 ， 主 要 是 由 于 以 下 两 类 问题 [108]: 

。 首先 ， 很 难 确定 哪些 参照 变量 可 以 用 来 评估 系统 自 适 性 ， 因 为 部 分 系统 可 能 无 法 
关闭 自 适 应 能 力 ,， 或 者 系统 本 身 具有 自 适 应 性 ， 不 存在 非 自 适应 版 本 [40]。 在 
TEL 推荐 系统 中 ， 如 果 能 够 测量 推荐 关闭 后 对 感知 有 用 性 的 影响 ， 那 么 变量 就 可 
以 得 到 确认 。 

。 其 次 ， 对 自 适 性 并 没有 一 个 合适 的 界定 标准 ， 或 者 说 很 少 有 被 公认 的 合适 的 标准 : 
一 方面 ， 客 观 指标 (如 持续 时 间 、 交 互 步骤 数量 、 获 取 的 知识 ) 往 往 不 能 体现 一 个 
系统 自 适 和 非 自 适 版 本 的 区 别 。 另 一 方面 ， 人 机 交互 研究 中 使 用 到 的 主观 标准 (如 
可 用 性 问卷 ) 很 少 用 到 自 适 系统 的 测量 上 。 在 TEL 上 ， 这 一 问题 和 定义 合适 的 评 
估 推 荐 策略 成 功 与 否 的 方法 (如 技术 、 度 量 、 工 具 ) 有 关 。 

在 这 些 评估 中 常见 的 一 个 问题 是 将 自 适 过 程 看 作 一 个 整体 进行 分 析 L[L11]j， 无 法 提供 
低 粒度 的 结果 ， 因 而 实用 性 较 低 ， 也 不 能 为 设计 师 提 供 系 统 局 部 (如 用 户 建 模 方法 、 领 
域 建 模 方法 、 推 荐 技术 ) 改 进 的 线索 。Brusilovsky 等 [13] 提 出 了 一 个 很 有 趣 的 方法 : 将 
自 适 过 程 解构 为 两 个 层级 ， 分 开 进 行 评 估 。 这 一 方法 背后 的 核心 思想 是 ， 评 估 一 个 自 适 
系统 时 ， 不 能 将 自 适 应 看 成 一 个 整体 的 /单独 的 流程 ， 而 是 要 分 解 成 为 不 同 的 组 合 部 分 ， 
如 果 必 要 和 可 行 ， 要 对 每 一 个 部 分 分 开 评估 [46]j。 这 一 观念 最 早 见 于 Totterdell 和 Boyle 
[94]， 他 们 提出 了 一 些 自 适 应 测量 指标 ， 对 应 的 是 自 适 应 用 户 界 面 逻 辑 模型 的 不 同 组 成 
部 分 ， 以 此 指导 自 适 应 导向 设计 。 此 外 ，Totterdell 和 Boyle 还 展示 了 两 种 评定 方法 ， 验 
证 了 “用户 模型 的 成 功 ? 这 一 说 法 (注意 : 在 他 们 这 个 案例 中 ， 用 户 模型 也 有 自 适 应 决策 
功能 ) : 

“用 户 模 型 构成 了 两 种 评估 方法 : 一 种 是 模型 对 用 户 困难 推断 的 准确 度 评估 ; 

另 一 种 是 对 界面 变化 的 有 效 性 评估 。”[94] 

与 两 个 层级 评估 自 适 应 的 观点 [13] 同 时 提出 的 还 有 另外 两 种 层级 式 ( 或 者 称 为 模块 式 ) 的 
评估 框架 。 第 一 种 是 Weibelzahl[106] 提 出 的 基于 过 程 的 框架 ， 它 包含 4 个 层级 ， 这 四 个 层级 
与 自 适 应 过 程 中 的 信息 处 理 步骤 相对 应 ， 包 括 数据 输入 评估 、 推 理 机 制 评估 、 自 适 决策 评估 
和 整体 交互 评估 。 第 二 种 是 Paramythis 等 [75] 提 出 的 框架 ， 它 对 自 适应 过 程 中 所 包含 的 不 同 
组 成 部 分 划分 得 更 细致 ， 同 时 还 讨论 了 对 于 不 同 自 适应 “模块 ”的 合适 的 评估 方法 与 工具 用 以 
辅助 开发 。 最 终 这 两 种 框架 的 融合 版 本 把 两 种 自 适 应 系统 评估 标准 都 考虑 了 进去 ， 同 时 也 提 
.出 了 相对 应 的 方法 和 所 需 的 工具 [109]。 一 些 自 适应 系统 评估 研究 拓展 了 这 一 模式 化 的 评估 
方法 (如 [15])， 但 还 没有 正式 开发 和 应 用 到 推荐 系统 中 ， 因 此 ， 应 用 到 TEL 推荐 之 前 ， 需 要 
对 其 效果 进行 检验 。 尽 管 如 此 ， 我 们 仍然 认为 在 评估 TEL 推荐 系统 时 ， 可 以 将 这 种 方法 整 
合 进 丰 富 的 视角 与 测量 中 。 接 下 来 我 们 将 对 相关 问题 进行 详细 阐述 。 
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12.5.2 评估 TEL 推荐 系统 时 需要 考虑 的 问题 


在 所 有 的 用 户 推荐 系统 中 ， 一 小 部 分 具有 特殊 属性 的 数据 集 是 开放 的 (如 MovieLens 
数据 集 、Book-Crossing 数据 集 或 者 Jester 数据 集 )， 这 些 数据 集 常用 作 评 估 新 推荐 算法 的 
标准 。 衡 量 推荐 系统 算法 的 一 些 常见 的 技术 性 测量 方法 有 准确 度 、 履 盖 率 、 执 行 时 间 表 
现 等 。 

而 在 TEL 应 用 领域 ， 对 于 正式 和 非 正 式 学 习 的 教育 驱动 推荐 系统 评估 ， 目 前 还 没 
有 可 用 的 标准 化 的 数据 集 和 评估 程序 。 只 关注 TEL 推荐 系统 的 技术 测量 ， 而 不 考虑 学 
习 者 实际 的 需求 与 特征 ， 这 种 做 法 很 值得 商 榨 。 因 此 需要 更 多 的 评估 程序 对 现 有 的 技术 
测量 方法 进行 补充 (参见 第 8 章 )。 举 例 来 说 ， 只 有 在 系统 让 学 习 过 程 变 得 更 有 效 、 高 
效 ， 或 者 更 有 吸引 力 时 ， 学 习 者 才能 从 这 种 由 TEL 支持 与 增强 的 系统 中 获 益 。 在 教育 
情景 下 ， 衡 量 系统 成 功 的 常见 指标 有 有 效 性 、 效 率 、 满 意 度 和 退出 率 。 有 效 性 标记 的 是 
一 个 学 习 时 段 内 内 容 完成 、 访 问 或 者 学 习 的 总 体 数 量 。 效 率 指 的 是 学 习 者 完成 其 学 习 目 
标 所 需 的 时 间 ， 与 计算 实际 学 习 时 间 中 的 有 效 度 变 量 相 关 。 满 意 度 反 映 的 是 学 习 者 对 给 
定 推荐 的 满意 程度 ， 满 意 度 与 学 习 者 的 学 习 动 力 紧密 相关 ， 因 而 是 一 个 重要 测量 指标 。 
最 后 ， 退 出 率 反 映 了 在 学 习 期 间 退 出 学 习 的 人 数 。 这 一 指标 在 教育 情境 下 很 重要 ， 因 为 
其 目标 是 要 让 尽 可 能 多 的 人 毕业 。 就 学 习 网 络 而 言 ， 来 源 于 社会 网 络 分 析 (SNA) (如 
[105]) 中 的 方法 和 指标 也 可 以 用 来 衡量 TEL 推荐 系统 的 成 功 。SNA 指标 可 用 于 估算 学 
习 者 的 贡献 给 网 络 整体 带 来 的 益处 。 还 有 一 些 特定 的 指标 ， 主 要 针对 的 是 非 正 式 学 习 网 
络 。SNA 能 帮助 发 现 学 习 者 在 学 习 网 络 中 所 起 的 多 样 性 作用 。 典 型 的 SNA 指标 有 和 多样 
性 、 中 心 度 、 紧 密度 和 内 聚 度 。 多 样 性 通过 组 合 个 体 学 习 路 径 到 最 成 功 的 学 习 路 径 来 测 
量 学 习 网 络 的 涌现 水 平 。 中 心 度 是 某 一 个 学 习 者 在 学 习 网 络 中 的 连通 性 ， 即 该 学 习 者 与 
网 络 中 其 他 学 习 者 之 间 所 形成 的 连接 数量 。 紧 密度 指 的 是 某 一 学 习 者 与 网 络 中 其 他 学 习 
者 的 紧密 程度 ， 它 代表 了 通过 与 其 他 网 络 成 员 连 接 来 直接 /间接 获取 信息 的 能 力 。 内 玛 
度 ， 从 另 一 方面 来 说 ， 指 的 是 学 习 者 彼此 之 间 在 多 大 程度 上 存在 强 关联 的 程度 。 如 果 学 
习 网 络 中 每 一 个 学 习 者 都 与 其 他 所 有 学 习 者 直接 相连 ， 则 可 以 认定 为 同伴 学 习 者 群体 。 
Drachsler 等 [24] 在 模拟 环境 中 使 用 这 一 方法 来 评估 非 正式 学 习 网 络 中 推荐 系统 对 学 习 者 
的 影响 (参见 第 18 章 ) 。 

将 所 有 这 些 不 同 成 分 整合 到 一 个 总 括 性 的 评估 框架 还 存在 一 些 方法 论 和 实际 操作 上 的 
困难 。 一 个 整体 的 方针 是 ， 可 以 采纳 教育 研究 中 经 典 评估 框架 ， 并 适 配 到 推荐 系统 场景 
中 。 我 们 将 介绍 如 何 将 使 用 4 种 不 同 层级 测量 的 Kirchpatrick 模型 L50] 应 用 到 对 TEL 情 
境 推荐 系统 测量 中 : 

。 用 户 反 应 他 们 有 何 想 法 和 感受 (“我 喜欢 收 到 的 推荐 吗 ?”); 

。 学 习 一 一 获得 的 知识 或 者 能 力 上 的 提升 (“在 推荐 系统 帮助 下 ， 我 学 到 了 我 需要 的 

东西 ， 获 得 了 一 些 新 的 想法 吗 ?”); 
。 行为 获取 的 知识 和 能 力 可 应 用 到 现实 生活 中 的 程度 (“我 会 实际 利用 这 些 推 荐 
的 新 信息 和 新 概念 吗 ?”) ; 

。 结果 对 用 户 在 学 习 / 工 作 中 表现 的 影响 (“推荐 给 我 的 信息 和 概念 能 帮助 提高 效 
能 和 结果 吗 ?”) 。 

因此 ， 对 TEL 推荐 系统 整体 评估 框架 的 定义 应 包含: 

。 对 评估 方法 和 工具 的 具体 分 析 ， 这 些 方法 和 工具 依据 一 系列 标准 来 对 TEL 推荐 系 
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统 技术 进行 评价 ， 未 来 也 可 以 用 于 对 某 些 组 成 部 分 (如 用 户 模型 、 领 域 模型 、 推 荐 
策略 和 算法 ) 的 评估 中 。 对 于 上 面 给 出 的 Kirckpatric 维度 的 案例 ， 应 该 包含 在 四 
个 维度 上 ， 对 测量 TEL 情境 中 推荐 效果 评估 方法 的 明确 定义 。 

。 测量 每 一 部 分 是 否 成 功 (如 测量 推荐 算法 的 准确 性 、 领 域 模 型 的 覆盖 率 ) 的 评估 标准 / 
指标 的 规格 。 该 案例 中 ， 应 该 包含 测量 TEL 引入 推荐 系统 效果 的 特定 指标 规格 。 

。 对 用 于 TEL 中 的 方法 和 工具 的 详细 阐述 ， 目 的 在 于 获取 参与 者 显 性 或 隐 性 的 评估 
数据 ， 如 测量 用 户 满 意 度 、 分 析 使 用 TEL 推荐 系统 对 工作 提升 的 影响 等 。 在 这 一 
案例 中 ， 应 该 列 出 用 于 测量 TEL 推荐 系统 效果 每 一 指标 的 工具 。 


12.6 总 结 与 展望 


本 章 介 绍 在 TEL 环境 部 署 推荐 系统 的 相关 问题 ， 并 强调 了 应 用 领域 的 特性 。 首 先 讨 
论 部 署 TEL 推荐 系统 的 上 下 文 ， 并 考虑 了 相关 的 用 户 任务 及 推荐 目标 。 相 关 工 作 的 综述 
来 自 之 前 介绍 过 的 自 适应 教育 超 媒体 和 学 习 网 络 ， 特 别 强调 它 如 何 使 用 在 TEL 推荐 的 正 
式 和 非 正 式 环境 中 。 然 后 ， 文 献 中 针对 TEL 推荐 的 调研 提出 了 一 个 有 关系 统 实际 实现 的 
重要 观点 。 其 中 特别 强调 了 评估 ， 这 引发 了 评估 TEL 推荐 系统 需求 和 问题 的 讨论 ， 据 我 
们 所 知 ， 这 是 首次 有 研究 试图 系统 地 覆盖 TEL 环境 的 推荐 系统 的 设计 (参考 第 11 章 ) 。 然 
而 ， 它 仅 能 提供 一 个 相关 问题 的 简要 概述 ， 留 下 几 个 方面 还 需要 有 更 多 的 探索 和 研究 。 

本 章 前 一 部 分 的 结果 表明 ，. 主 要 的 研究 挑战 之 一 是 在 TEL 中 引入 推荐 系统 该 如 何 完 
成 系统 开发 ， 并 评价 它们 的 效果 。 因 此 产生 的 是 能 够 支持 推荐 系统 相关 TEL 任务 的 系统 
分 析 ， 这 样 就 可 以 明确 需要 被 考虑 的 特殊 需求 。 此 外 ， 如 何 开发 遵循 分 层 方法 的 具体 评价 
框架 ， 是 一 个 开放 的 问题 。 这 些 框架 通过 结合 多 种 评价 方法 、 度 量 和 手段 ， 可 以 专注 于 尽 - 
可 能 纳入 很 多 的 评价 维度 ， 也 包括 教学 上 的 维度 。 

此 外 ， 对 于 TEL 领域 的 各 个 研究 小 组 来 说 ， 一 些 课 题 具有 很 高 的 研究 价值 。 例 如 ， 推 
荐 学 习 者 在 正式 和 非 正式 的 学 习 中 充分 利用 情境 化 推荐 系统 的 支持 已 经 成 为 一 个 重要 的 方 
式 。 这 些 推荐 系统 也 叫 作 情 景 感知 推荐 系统 (参考 [61] 和 第 7 章 )， 例 如 ， 使 用 地 理 位 置 为 用 
户 推荐 相关 的 资源 ， 这 种 语 境 化 变 得 重要 ; 从 不 同 国家 的 大 量 资料 库 中 推荐 多 种 语言 的 教育 
资源 ， 并 遵守 不 同 课程 的 要 求 L[101]。 此 外 ， 教 学 情境 感知 应 该 包括 教学 法 方面 的 内 容 ， 如 
先 验 知识 、 学 习 目 标 或 学 习 时 间 ， 并 将 这 些 教学 推理 能 人 协同 过 滤 驱 动 的 推荐 结果 中 。 

另 一 种 有 前 景 的 方法 是 在 TEL 推荐 系统 中 使 用 多 标准 输入 (参考 第 24 章 ) 。 用 户 ( 学 生 
和 老师 ) 不 仅 可 以 基于 复杂 程度 、 课 程 定位 或 完成 学 习 材 料 所 需 的 时 间 ， 而 且 也 可 以 从 不 同 
的 隐 式 资源 推断 出 来 要 选择 学 习 的 资源 。 这 种 多 维 的 输入 对 推荐 的 适用 性 可 能 有 很 高 的 冲 
击 。 在 正式 和 非 正式 学 习 中 ， 相 关 的 问题 是 TEL 缺乏 特定 的 数据 集 。 在 不 同 的 推荐 系统 中 ， 
有 很 多 数据 集合 能 被 使 用 (比如 ，MovieLens、BookCrossing、Jester Collaborative Filtering 
Dataset), TEL 科研 群体 仍然 工作 在 较 小 的 自制 的 数据 集 上 ， 很 少 对 外 公开 [66]。 
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摘要 ”在 过 去 的 10 年， 大 量 的 推荐 系统 研究 表明 ， 采 用 基于 评价 接口 (如 “向 我 展示 
类 似 于 商品 A 且 更 便宜 的 商品 >) 的 会 话 架 构 带 来 诸多 好 处 。 随 着 推荐 系统 具有 越 来 越 强烈 
的 需要 去 帮助 用 户 摆脱 在 众多 产品 中 进行 选择 时 的 困扰 ， 基 于 评价 的 推荐 方式 引起 更 多 人 
的 兴趣 。 最 初 提出 的 基于 评价 的 方式 是 为 了 解决 会 话 推荐 中 发 现 偏好 这 个 核心 问题 ， 而 如 
今 ， 评 价 方式 已 经 在 如 群 推荐 、 混 合 主动 推荐 、 自 适应 用 户 界 面 、 推 荐 解释 等 许多 相关 领 
域 中 成 为 一 个 热门 的 话题 。 本 章 对 近 几 年 评价 研究 工作 进行 了 一 个 非 技术 性 概述 ， 则 在 为 
刚 进 入 本 领域 的 研究 者 和 实践 者 提供 一 个 综合 且 简 洁 的 参考 来 源 。 


13.1 简介 


评价 研究 领域 的 改进 很 大 程度 上 受到 了 在 线 用 户 的 需求 变化 和 待 探 索 的 复杂 产品 领域 
的 影响 。 过 去 10 年 ， 多 种 基于 评价 的 推荐 方法 被 提出 ， 并 且 这 些 方法 在 提高 推荐 效果 上 
的 潜力 也 受到 了 证 实 。 值 得 商检 的 是 ， 一 项 研究 重要 性 的 衡量 ， 不 但 依据 其 能 解决 现存 的 
问题 的 数量 (例如 ， 提 出 解决 已 知 问题 的 方法 ) ， 而 且 也 依据 其 提出 问题 的 数量 ， 这 些 问 题 
的 答案 作为 下 一 步 研究 的 目标 。 

本 章 围 绕 早期 研究 于 这 个 领域 中 的 研究 者 ， 旨 在 为 近年 研究 的 焦点 之 一 一 一 评价 方式 及 其 
所 能 达成 的 效果 与 存在 的 陷阱 一 一 提供 一 个 有 用 的 且 深入 的 非 技术 性 概述 。 在 13. 2 节 ， 我 们 描 
述 了 一 些 在 早期 评价 系统 中 的 做 法 ， 以 及 采用 此 类 方法 所 获得 的 好 处 。 同 时 ， 在 13. 3 节 列 出 了 
一 些 需要 改进 的 关键 问题 和 挑战 1) 基 于 优化 偏好 获取 的 评价 展现 ;2) 基 于 评价 的 推荐 系统 的 
检索 性 能 。13. 4 节 对 影响 跨 平 台 反馈 和 用 户 环境 下 集成 评价 模型 时 的 各 种 设计 考虑 因素 进行 概 
述 ， 其 中 用 户 环境 包括 : 移动 平台 、 个 人 和 协作 平台 等 。13. 5 节 概括 了 一 些 被 业界 人 士 采纳 并 
沿用 至 今 的 资源 、 方 法 和 评价 标准 。13. 6 节 概 括 了 一 些 现 存 的 基于 评价 推荐 的 挑战 和 机 会 。 


13.2 早期 : 评价 系统 /已 得 益处 


交互 推荐 系统 通常 让 用 户 参 与 到 一 个 交互 的 对 话 中 ， 以 此 来 得 知 他 们 的 偏好 ， 并 使 用 用 户 
对 话 中 的 反馈 信息 来 提高 系统 的 推荐 精准 度 。 许 多 会 话 推荐 系统 利用 实际 中 使 用 的 例子 来 发 现 
偏好 (详情 参见 第 21 章 )。 比 如 ， 给 一 个 用 户 展示 一 个 或 者 多 个 案例 /推荐 品 ( 例 如 ， 一 部 电影 、 
书 、 照 相机 )， 然 后 让 他 对 展示 的 物品 提供 一 个 反馈 (进行 评分 ， 或 表示 是 否 喜 欢 ) 。 在 进行 推荐 
系统 研究 和 开发 基于 实例 的 交互 架构 中 ， 评 价 反馈 模型 已 经 成 为 了 一 个 热门 的 话题 。 其 主要 原 
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因 是 该 模型 在 用 户 提 供 反馈 所 需要 付出 的 额外 代价 和 这 些 反馈 信息 的 价值 之 间 做 了 一 个 可 接受 
的 折 中 。 与 其 他 标准 值 抽 取 方 法 相 比 ， 它 只 需要 用 户 对 当前 的 需求 (比如 ,“ 给 我 展示 更 多 像 物 
品 A 但 某 特征 不 同 的 物品 ”) 提 供 很 少 额外 的 操作 来 表示 一 个 相对 明确 的 反馈 。 评 价 也 非常 适合 
最 基本 的 接口 界面 以 及 只 对 推荐 领域 有 基本 理解 的 用 户 [7，8，65]。 

在 很 多 情况 下 ， 我 们 不 能 假设 用 户 起 初 就 完全 清楚 自己 的 偏好 [48]， 或 者 对 特征 的 权衡 
有 一 个 清晰 的 认识 (相关 讨论 请 见 第 11 章 ) 。 比 如 ， 一 位 用 户 想 买 一 台 笔 记 本 电脑 ， 开 始 并 
没有 考虑 通常 需要 在 产品 的 质量 和 内 置 CROM 之 间 做 一 个 权衡 ， 这 时 用 户 如 果 使 用 “ 轻 于 
2 公斤” 而且“ 带 CD-ROM” 的 条 件 去 查找 ， 那 么 可 能 根本 找 不 到 同时 满足 这 两 个 条 件 的 计算 
机 。 而 对 这 个 领域 的 产品 特性 和 可 选 条 件 越 来 越 清楚 时 ， 用 户 的 偏好 通常 又 发 生 了 改变 ， 变 
得 更 加 挑 晶 了 [48]。 在 发 现 有 效 信息 前 ， 用 户 往往 不 会 明确 表达 他 们 的 偏好 [67]。 事 实 上 ， 
这 是 不 可 取 的 ， 因 为 有 些 时候 只 需要 部 分 偏好 信息 就 能 够 为 用 户 提供 一 个 很 好 的 推荐 [17]。 

基于 评价 的 交互 式 推荐 不 但 在 用 户 浏 览 产品 类 别 时 提供 了 灵活 的 支持 ， 而 且 能 帮助 用 户 更 
好 地 了 解 自己 的 需求 ; 它 不 会 在 一 开始 就 让 用 户 表 明 他 们 的 偏好 ， 而 是 在 一 系列 推荐 周期 中 建 
立 用 户 偏好 信息 。 在 每 一 次 推荐 会 话 中 ， 系 统 为 用 户 推荐 一 个 或 多 个 物品 ， 并 邀请 他 们 对 其 中 一 
个 物品 进行 评价 。 特 征 的 评价 有 两 种 典型 的 形式 : 有 向 或 替代 (在 [37] 已 定义 的 名 词 )。 有 向 评价 会 
影响 一 个 量化 特征 价值 的 增加 或 降低 ， 比 如 ,“ 便 宜 ” 表 示 少 于 某 价格 。 蔡 代 评 价 人 允许 用 任何 值 ( 除 
了 被 评价 的 值 ) 来 替换 非 量 化 特征 ， 比 如 ,“ 不 同 的 制造 商 ” 指 代 “! 三 制造 商 ”。 返 回 满足 所 选 评价 
标准 的 推荐 项 ， 并 邀请 用 户 按 其 需求 对 此 推荐 进行 评价 。 这 种 处 理 方式 会 持续 到 以 下 几 种 情况 的 
RE: 1) 用 户 接 受 推荐 ; 2) 所 有 潜在 的 可 能 结果 都 已 经 展示 过 了 ; 3) 用 户 过 早 地 结束 了 这 个 会 话 。 

早期 的 工作 要 追溯 到 20 世纪 80 年 代 初 期 ，RABBIT 系统 [70，71j 将 评价 机 制作 为 构 
造 数据 库 查 询 的 一 个 新 的 接口 范例 进行 了 介绍 。 用 户 能够 使 用 类 似 禁 止 或 者 设 限 等 选择 项 
来 评价 实例 记录 的 域 。 在 用 户 反 馈 的 基础 上 ， 系 统 可 以 重新 构造 查询 条 件 ， 然 后 展示 另外 
的 样 例 记 录 。 由 Burke 等 开发 的 FindMe 系统 [7，8，19]， 是 首 个 在 基于 Web 推荐 中 使 用 
评价 机 制 ， 其 推荐 注重 于 引导 用 户 去 了 解 可 选择 的 空间 ? 。 起 初 ，FindMe 推荐 系统 是 作为 
浏览 助手 被 开发 的 ， 使 用 为 展示 的 实例 提供 评价 的 方式 帮助 用 户 在 大 量 的 信息 中 进行 浏 
览 。 例 如 ， 针 对 餐馆 的 Entrée、 针 对 汽车 的 Car Navigator、 针 对 公寓 的 RentMe、 针 对 电 
影 租借 的 Video Navigator® 等 基于 实例 评价 的 系统 。 其 他 早期 的 基于 实例 的 评价 系统 包 
括 : Apt Decision[64], SmartClient[53, 54, 55], Automated Travel Assistant (ATA) 
[22]. Æ 13. 3 节 中 ， 我 们 概述 了 这 些 基 于 评价 的 系统 和 后 续 研 究 中 要 解决 的 关键 性 挑战 。 


13.3 评价 系统 的 表述 与 检索 挑战 


对 于 早期 的 系统 和 近期 的 评价 机 制 审视 方法 有 很 多 维度 ， 本 节 重 点 关注 其 中 的 两 个 维度 : 
评价 的 表述 与 推荐 的 检索 。 在 第 一 个 例子 中 ， 我 们 对 已 经 用 于 优化 偏好 获取 的 可 选 评价 的 展示 
方式 或 者 构造 方法 进行 了 区 分 ， 描 述 了 作为 反馈 选项 展示 给 用 户 的 那些 评价 属性 ， 是 如 何 表现 
出 近 异 的 局 限 和 好 处 。 第 二 个 例子 中 ， 我 们 概述 了 已 经 在 评价 机 制 系统 提出 来 的 检索 挑战 关键 
性 的 问题 ， 并 讨论 了 这 些 问题 如 何 影响 更 复杂 的 偏好 建 模 与 修改 的 方法 。 


13. 3.1 评价 表述 的 方式 
在 过 去 的 10 年 里 ， 人 们 提出 了 许多 评价 展示 的 替换 方案 。Entrée[8] 餐 馆 推荐 系统 是 


O 近期 的 研究 强调 ， 用 户 探求 选择 空间 的 需求 和 期 望 较 短 推荐 对 话 之 间 存 在 矛盾 。 
© The Wasabi Personal Shopper[4] 是 FindMe 系统 的 一 个 通用 的 、 领 域 无 关 的 版 本 。 
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FindMe 系统 系列 中 ， 最 早 被 人 熟知 的 成 员 之 一 。Entrée 提供 了 两 种 初始 化 用 户 偏好 的 方法 。 
一 种 是 指明 一 个 与 用 户 想 要 找 的 餐馆 相似 的 已 知 餐馆 ， 或 者 让 用 户 指明 他 们 用 和 餐 的 兴趣 的 高 
层 特征 来 启动 推荐 会 话 。 高 层 特征 包括 7 个 预定 义 的 单一 评价 选择 ， 比 如 ， 便 宜 用 于 评价 价 
格 特征 ;更 正式 用 于 评价 风格 特征 。 评 价 用 于 生成 下 一 个 推荐 周期 临时 的 产品 过 滤器 ， 滤 除 
了 不 在 考虑 范围 内 的 餐馆 。 本 章 讨论 一 些 挑战 ， 它 们 促使 该 领域 进一步 研究 和 发 展 。 
13.3.1. 1. 过 分 的 评价 与 元 长 的 推荐 交互 

每 个 推荐 周期 中 ， 单 一 评价 只 允许 用 户 表达 一 个 特征 上 的 偏好 ， 这 最 终 限 制 了 推荐 系 
统 的 推荐 范围 ， 并 导致 了 很 多 不 必要 的 推荐 交互 。 此 外 ， 在 一 些 特殊 领域 ， 用 户 可 能 不 清 
楚 特 征 之 间 的 权衡 关系 ， 因 此 他 们 可 能 更 倾向 于 继续 评价 一 个 特定 的 特征 (如 价格 )， 直 到 
发 现 一 个 可 以 接受 的 推荐 结果 。 然 而 ， 他 们 可 能 会 发 现 另 外 一 个 很 重要 的 特征 的 值 被 改变 
后 ， 推 荐 结果 就 不 符合 预期 了 [39]j。 一 个 替代 的 策略 是 考虑 使 用 复合 评价 (在 [26] 中 首次 
被 介绍 )， 这 些 复合 评价 控制 多 个 特征 ， 因 为 在 一 个 推荐 周期 中 收集 了 多 个 偏好 信息 ， 所 
以 很 有 可 能 提高 推荐 系统 的 效率 。 可 以 保证 的 是 ， 使 用 复合 评价 可 以 使 用 户 离 想 要 的 推荐 
更 近 ， 因 此 总 之 减少 了 会 话 的 长 度 / 交 互 时 间 。 

其 实 ， 复 合 评价 并 不 是 一 个 新 的 想法 ， 早 期 的 FindMe 系统 [7] 中 的 Car Navigator 系 
统 ( 示 例 见 图 13. 1) 就 使 用 了 复合 评价 的 方式 。 汽 车 由 马力 、 价 格 、 运 动 、 油 耗 等 特征 来 描 
述 ， 用 户 能 直接 对 这 些 特征 进行 操作 。 复 合 评价 与 单一 的 特征 级 别 的 评价 并 列 展 示 ， 并 为 
用 户 提供 了 2 个 可 选择 的 途径 来 改善 推荐 。 举 例 说 明 ， 当 选择 运动 (sportier) 这 个 复合 特 
征 时 ， 将 依据 一 些 特征 对 预 留 的 选项 进行 过 滤 一 一 发 动机 动力 大 小 、 加 速 和 价格 这 些 特征 
的 值 都 增加 了 。 类 似 地 ， 在 PC( 个 人 电脑 ) 的 推荐 场景 中 ， 复 合 评价 一 一 高 性 能 可 能 会 同 
时 增加 处 理 器 速度 、 内 存 、 硬 盘 容 量 和 价格 等 特征 的 值 。 


复合 评价 单一 评价 





图 13.1 演示 Car Navigator 系统 是 如 何 展示 固定 的 单一 与 组 合 评价 的 
13. 3. 1.2 评价 元 余 与 隐藏 的 特征 依赖 
由 于 观察 到 固定 的 评价 方式 不 是 总 能 得 到 相关 确切 的 结果 ， 所 以 自动 生成 评价 的 概念 被 提 
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出 来 ， 最 先 由 McCarthy 等 提出 [26]。 他 们 认识 到 ， 会 话 死角 会 导致 一 个 用 户 使 用 一 个 评价 (个 
体 的 或 复合 的 ?进行 过 滤 时 发 现 没有 符合 条 件 的 推荐 结果 [18，37，39]。 比 如 ， 在 汽车 检索 系统 
中 ， 即 使 没有 推荐 结果 对 应 评价 标准 “运动 型 的 情况 下 ， 其 仍然 作为 一 个 选项 被 展示 出 来 。 这 
种 固定 评价 方式 (包括 单一 和 复合 ) 让 用 户 对 这 种 情况 下 的 可 供 选 择 的 推荐 选项 很 不 理解 。 事 实 
上 ， 他 们 完全 可 以 避免 这 种 对 用 户 困 扰 的 情况 并 去 掉 多 余 的 交互 接口 。 例 如 ， 对 这 些 固 定 的 标 
签 的 真实 意义 ， 用 户 的 理解 不 需要 完全 相同 (比如 ， 用 户 不 需要 知道 采用 了 什么 样 的 隐藏 特征 来 
进行 过 滤 )。 不 可 避免 的 是 ， 这 意味 着 用 户 会 发 现 这 些 固定 的 复合 评价 的 用 处 变 小 了 。 
McCarthy 等 [26] 讨 论 了 是 否 需要 一 个 更 加 灵活 的 用 于 生成 评价 的 动态 方法 ， 在 每 个 推荐 


周期 中 ， 这 个 方法 动态 地 对 复合 评价 进行 组 合 ， 以 此 展示 可 用 评价 包括 : 1) 更 好 的 重点 推 . 


fr; 2) 限 制 交 互 见 余 ; 3) 消 除 用 户 的 疑虑 。 他 们 证 实 了 一 个 观点 : 只 有 包含 可 用 候选 集 的 复 
合 评价 才 需 要 被 展示 给 用 户 。 当 然 ， 使 用 同样 的 基本 理论 生成 一 个 个 体 评 价 也 是 合理 的 ， 就 
如 Tweak 系统 [39] 中 实现 的 那样 ， 确 保 了 只 为 用 户 展示 个 体 评价 选项 ， 并 且 有 至 少 一 个 产品 
对 应 于 此 选项 。 三 种 动态 生成 复合 评价 的 方法 被 提出 [26，73，12]j。 所 有 的 这 些 方法 为 用 户 
提供 了 多 特征 评价 的 选择 ， 基 于 这 种 评价 (例如 ， 推 荐 结果 ) 的 一 个 应 用 将 会 为 用 户 进行 特征 
的 改变 。 例 如 ， 一 个 用 户 想 要 看 一 些 与 推荐 的 计算 机 相似 ,但 是 更 加 便宜 、 有 更 大 的 内 存 ， 
并 且 不 是 同一 个 生产 商 生 产 的 计算 机 ， 他 可 以 从 不 同 的 厂商 中 选择 一 一 更 大 内 存 ， 更 少 价 
格 。 所 有 提 到 的 这 些 方法 ， 都 被 证 明 在 一 定 程 度 上 对 推荐 效率 、 准 确 率 、 有 效 性 、 可 用 性 等 
性 能 产生 了 有 利 影 响 。 区 别 这 些 方法 的 关键 因素 是 影响 产生 评价 的 知识 (比如 ， 领 域 知 识 和 
用 户 偏好 知识 的 比较 )。 下 面 将 描述 各 种 方法 的 不 同 之 处 与 被 提出 的 原因 。 

13.3. 1.3. ”有 限 的 产品 展示 空间 

Reilly 等 [59] 在 他 们 的 QwikShop 系统 ( 见 图 13. 2) 中 演示 了 在 推荐 开始 之 前 ， 如 何 只 
用 推荐 候选 集 的 领域 知识 来 自动 生成 复合 评价 。 他 们 专注 于 通过 加 深 用 户 对 当前 推荐 结果 
的 特征 协调 与 相互 依赖 的 认识 ， 来 提高 他 们 对 用 于 进行 推荐 候选 集 调整 的 那些 特性 的 理解 
深度 。 称 为 动态 复合 评价 算法 ， 使 用 了 数据 挖掘 中 关联 规则 的 Aprior 算法 [1] 来 发 现 推荐 
待 选集 中 频繁 出 现 的 特征 关系 。 通常， 比如 ，“ 更 大 分 辩 率 ”更 大 内 存 ”“ 不 同 制造 商 ”( 与 
当前 的 推荐 结果 比较 ) 这 种 形式 的 大 量 复合 评价 是 由 这 种 方法 论 产 生 的 。 从 用 户 的 角度 来 
看 ， 展 示 大 量 的 复合 评价 选项 是 不 可 取 的 。 为 了 在 单个 的 标准 评价 选项 旁 ， 给 用 户 展示 指 
定 个 数 的 组 合 评价 ， 可 以 采用 一 些 策略 来 对 组 合 评价 选项 进行 排序 ， 如 支持 度 、 置 信 度 、 
平衡 度 、 提 升 度 和 说 服 度 S McCarthy 等 [26] 与 Reilly 等 L56] 调 查 研 究 了 根据 支持 度 的 值 
来 进行 复合 评价 的 最 佳 排序 (其 中 的 支持 度 指 满足 评价 条 件 的 产品 比例 )。 他 们 表明 低 支 持 
度 的 组 合 评价 选项 在 可 用 性 和 专注 搜索 能 力 之 间 能 找到 一 个 很 好 的 平衡 点 。 

最 终 选 择 的 组 合 评价 选项 ， 可 能 会 表现 出 有 限 的 特征 多 样 性 (例如 ， 他 们 的 组 成 个 体 
特征 能 够 高 度 重 肆 ) ， 因 为 现 有 的 很 多 选项 对 于 当前 的 推荐 结果 来 说 ， 其 特征 差异 很 小 。 
推荐 系统 领域 中 的 人 都 熟悉 的 一 个 问题 ， 即 用 户 选 择 的 推荐 集 与 他 们 的 偏好 有 关 ， 但 又 各 
不 相同 。 与 此 对 应 的 ， 相 关 文 献 也 提出 了 一 些 强化 多 样 性 的 解决 方案 ( 见 13. 3.2 节 )， 并 
研究 出 了 一 些 动态 展示 多 样 性 的 复合 评价 的 方法 [28]， 这 些 方法 生成 的 反馈 选项 ， 使 得 用 
户 适用 性 最 高 提升 了 32%% 。 这 类 方法 的 潜在 限制 是 ， 它 并 没有 将 用 户 的 偏好 考虑 进去 。 在 
QuikShop 系统 中 ， 用 户 偏好 只 影响 了 推荐 结果 的 选择 ， 并 没有 作为 反馈 选项 展示 给 用 户 。 
然而 ， 作 为 用 户 偏好 的 关系 松散 的 模型 ， 有 更 大 的 潜力 来 发 现 有 意外 效果 的 推荐 结果 。 


日 ”这 些 度量 标准 是 关联 规则 中 常用 的 [1]。 
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图 13.2 QwikShop 评价 系统 截图 


13.3.1.4 被 展示 反馈 选项 之 间 的 弱 相 关 性 

如 上 所 述 ， 根 据 Reilly 等 的 方法 所 生成 的 复合 评价 并 不 保证 与 用 户 的 相关 性 ， 因 为 产 
生 的 方式 只 与 产品 领域 知识 有 关 。Zhang 和 Pu[73] 提 出 了 一 个 依赖 用 户 偏好 知识 的 可 选 
方法 。 他 们 的 多 属性 效用 理论 (Mutil-Attribute Utility Theory, MAUT) 5 SmartClient 系 
统 [53，54，55] 所 实现 的 方法 相似 同样 实现 了 这 个 功能 ， 即 用 于 动态 生成 复合 评价 。 如 
图 13. 3 所 示 ， 他 们 的 EasyShop 推荐 系统 主要 是 维护 基于 用 户 的 评价 反馈 的 偏好 模型 ， 并 
计算 所 有 的 待 推荐 选项 的 产品 效用 值 。 
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i 13.3 EasyShop 评价 系统 的 截图 [73] 


具有 最 高 效用 值 的 产品 会 被 选择 作为 下 一 个 推荐 ， 并 且 下 一 一 批 具有 最 高 效用 值 的 个 
产品 的 复合 评价 会 作为 反馈 选项 展示 出 来 。 离 线 评估 比较 现实 ， 这 些 面向 襄 好 的 复合 评价 
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比 McCarthy 等 描述 的 方法 [26] 更 加 接近 用 户 意图 评价 的 标准 。 另 外 ， 他 们 趋 于 使 用 更 短 
但 有 更 高 推荐 准确 度 的 会 话 。 但 是 ，MAUT 方法 也 受到 一 些 缺 点 的 困扰 。 首 先 ， 每 个 由 
MAUT 方法 生成 的 复合 评价 只 描述 一 个 产品 ， 因 此 ， 这 些 评价 局 限 了 提供 给 用 户 更 多 物 
品 的 机 会 ， 其 次 ， 这 种 方法 假定 了 一 个 准确 的 用 户 偏 好 模型 。 但 是 ， 用 户 的 偏好 一 般 是 不 
固定 的 ， 而 且 经 常会 很 快 改变 ( 见 13. 3.2 节 ); 最 后 ， 它 不 能 在 评价 中 提高 多 样 性 ， 并 且 
在 复合 评价 中 更 趋 于 包含 大 量 的 特征 。 

13. 3. 1.5 领域 局 限 性 与 偏好 驱动 的 方法 


Chen 和 Pu[L12] 提 出 了 一 个 动态 生成 复合 评价 的 方法 ， 目 标 是 保留 之 前 提 到 的 方法 的 
优势 ， 同 时 最 小 化 其 局 限 性 。 他 们 基于 偏好 的 方法 目标 是 动态 生成 多 样 的 评价 选项 ， 这 些 
评价 选项 适应 于 用 户 的 偏好 ， 而 且 代表 了 待 推荐 集 。 

用 一 个 多 属性 效用 模型 来 表示 用 户 偏好 ， 一 个 数据 挖掘 算法 生成 复合 评价 集 。 这 些 复 
合 评价 是 最 匹配 用 户 的 偏好 模型 的 可 用 待 推荐 集 的 分 类 。 在 每 个 复合 评价 中 ， 提 取 一 些 精 
选 的 产品 来 进行 展示 ， 使 得 他 们 针对 当前 推荐 显示 出 高 权衡 效用 且 相 互 之 间 具 有 差异 。 一 
个 类 别 的 权衡 效用 表示 了 它 适应 用 户 模 型 的 程度 。 直 觉 上 ， 在 当前 最 好 的 推荐 候选 集 上 ， 
权衡 效用 越 高 的 类 目 包 含 的 产品 更 有 潜力 使 利 大 于 弊 ( 见 图 13. 4)。 


Manufacturer Price = MegaPixels Optical 


pearl Memory type Sae Lco bee Denth Weight ; 
! Canon $242.00 5.0 MP 3x CompactFlash Card 32 MB 1.8 in 137in 8.302 choose 
Nikon $167.95 4 MP 3x SD Memory Card 14 MB 1.8 in 1,4in 4602 choose 
3 Canon X $230.00 41 MP 3%, CompactFlash Card 32 MB 15in  109in b53ór thoose . 

Canon $160.00 3.3 MP 3» SD Memory Card 16 MB 2in 083m 4.0602 choose 

Canon $219.18 42 MP 4x MuRiMedia Card 16 MB isin  151ln $3502 choos 

Canon — $163.50 32MP 4x MultiMedia Card 16 MB 18 in 15in 6.302 . choose 
Canon — $199.40 3,2 MP 2.2% SR Memory Card 16 ME 15ih 14i (S802 iioa. 
ESSEN Oh NTC SRM RUDI DERE 
i Sony $365.00 7.2 MP 3x Internal Memory 32 MB 25n 1.5 in $.902 choose 
i Canon ` $439.99 21 MP 3x SD Memory Card 22 MB Zin  1i04in 602 thane’ 
Fuji $253.00 6.3 MP 4x XD-Picture Card 16 MB 21in 1.4 in 7.102 £nhoose 

j Sony $335.00 7,2 MP 3» Internal Memory 32 MB 210 iin Sez thpose 
: Nikon $304.18 7.1MP 3x Internal Memory 13.5 MB 2in 1.4 in 5,302 choose 
1 Olympus — $334.00 74WMP Sx XD-Picture Card 32 MB 2.0in i7in 7ioz choose: 
Pentax $238.99 5.3 MP 3x Internal Memory 10 MB 1.8 in 0.8in 3.702 choose 

Canon $273.18 4.0 MP 3x SD Memory Card 16 MB 2in O.82in 4.5902 choose 

Nikon $329.95 5.1 MP 9x Internal Memory 12 MB 2.5 in 0.8 in 4.202 choose 

Canon $316.18 5.3 MP 3x SD Memory Card 16 MB Bin obrin 45902 choose 

Casio $386.00 7.2 Mp au Internal Memory 8.3 MB 2.5in 0.88 in 4.4802 choose 

Fuj $3098 6.3 MP E XD-Picture Card 16 MB 25in 11in 5.802 thous 


Panasonic $386.00 5.0 MP 12x SD Memory Card 16 MB isin aasin 1*3? noose 
Konica Minolta $342.99 5.0 MP 12x SD Memory Card 16 MB gin 33in i20z choose 
Fujt $259.18 4.23 MP 10x XD-Picture Card 16 MB 15in 3.3in 11.902 choose 

Olympus $253.00 4.0 MP 10x xD-Picture Card 16 MB isin 27in 9oz xhoose 
Olympus $284.99 4.0 MP 10x XD-Picture Card 16 MB 1.B in 22in 10602 ¢haose 
Nikon $259.18 4,2 MP B.3x internal Memory 13,5 MB iin 22in Yor moore 





图 13.4 基于 偏好 组 织 的 评价 展示 方法 [12] 


13.3.1.6 被 限制 的 用 户 控制 
近期 的 工作 中 ，Chen 和 PuL9] 对 系统 推荐 和 用 户 促进 的 评价 方法 进行 了 区 分 ( 见 图 13.5). 
根据 此 观点 ， 我 们 集中 讨论 了 他 们 提出 的 系统 推荐 复合 评价 ， 该 方法 没有 用 户 参 与 定义 。Chen 
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和 Pu 演示 了 一 个 用 户 查 找 与 当前 推荐 的 相机 相关 的 、 REND NUNC 
的 例子 。 假 设 没有 与 用 户 当 前 需求 相符 eee EE) 
合 的 复合 评价 建议 ， 甚 至 没有 能 给 他 们 ie Casse ur Da Gd eT | 





一 些 信 息 的 后 续 推 荐 选项 ， 如 更 大 屏幕 、 


| 
Canon, 5 3M pixels 12x opbcal zoom, 16 MB memory. 1 Bin screen size, | 
297 inteckness, 404 7 g renga deca | 





更 大 存储 等 。 鉴 于 此 ， 用 户 只 能 逐个 地 


选择 单个 特征 的 评价 ， 这 就 有 可 能 会 导 ew n ”和 
致 一 个 较 长 的 交互 周期 和 更 低 的 决策 准 “ww $e — pum D c 

确 度 。 他 们 建议 可 以 允许 用 户 更 加 灵活 |。 MEE -—-2R 

地 定义 他 们 自己 的 复合 评价 来 对 这 种 限 oss em olmassa 

制 进行 处 理 。 假 设 是 只 有 包含 了 后 续 推 mee enm owe omms M 
荐 选项 的 单个 评价 选项 会 被 展示 给 用 户 | Uem og 

(如 动态 的 单个 评价 )。 用 户 动机 的 评价 方 unas ante oMi 

法 ， 让 用 户 选择 一 个 或 多 个 评价 来 对 这 些 | ee ew] ! 





种 类 (如 复合 评价 ) 的 选项 进行 任意 组 合 。 

Shearin 和 Lieberman [ 64 ] #2 H AY 
Apt Decision 系统 是 一 个 早期 评价 系统 的 例子 ， 同 样 实现 了 用 户 驱动 的 方法 。 在 房屋 租赁 市 场 的 
用 户 可 以 对 与 推荐 租房 描述 相关 的 21 个 可 选 特征 自由 地 进行 评判 。Chen 和 Pu 选择 了 其 他 不 同 
的 方法 ， 让 用 户 有 更 大 的 控制 能 力 去 选用 那些 偏好 限制 来 影响 推荐 。 他 们 描述 了 用 户 是 如 何 为 
了 推荐 特征 的 改善 和 折 中 ， 自 主 地 指明 其 权衡 标准 。 例 如 ， 用 户 能 表示 他 们 想 看 到 一 个 如 图 
13. 5 所 示 的 推荐 ( 比 当前 推荐 的 产品 便宜 一 个 指定 的 值 ) 。 

作为 对 比 ， 13.6 显示 了 Apt Decision 
系统 提供 了 用 户 对 偏好 属性 内 容 的 直接 访问 ， 
用 户 能 轻易 地 对 偏好 进行 修改 (增加 和 减少 偏 
好 程度 )。 除 了 让 用 户 指明 他 们 对 特征 偏好 的 
重要 性 ，Apt Decision 并 不 支持 用 户 对 愿意 接 
受 的 妥协 程度 进行 更 加 详细 的 指定 。Chen 和 
Pu 表示 ， 通 过 用 户 促 进 评价 的 方式 ， 用 户 能 
获得 较 高 的 选择 信心 和 决策 准确 度 。 但 是 ， 
有 些 用 户 仍 然 更 偏好 于 系统 提议 方式 的 评价 ， 
他 们 党 得 当 有 相关 选项 展示 出 来 的 情况 下 ， 
这 些 评价 的 使 用 很 直观 ， 并 且 能 快速 地 引导 
至 合适 的 产品 。SmartClient[53，54，55] 是 设 
计 用 来 帮助 用 户 查 找 航班 信息 的 系统 ， 在 偏 
好 提取 上 也 提供 了 较 大 的 用 户 控制 能 力 。 它 $ —€— — 一 
同时 也 作为 度假 套餐 、 保 险 单 、 住 房租 赁 的 图 13.6 Apt Decision 的 用 户 推进 的 评价 交互 截图 [64] 
推荐 系统 。 产 品 的 挑选 由 一 个 决策 理论 问题 来 表示 ， 用 户 尝试 着 挑选 更 加 满足 他 们 偏好 的 产品 。 
选择 最 好 的 产品 通常 是 一 个 权衡 的 问题 ， 因 为 用 户 需要 决定 在 产品 各 种 特征 之 中 如 何 取舍 。 
SmartClient 将 评价 机 制作 为 软 限制 。 交 互 接口 允许 用 户 通过 指定 权重 来 直接 为 每 个 属性 构造 一 个 
评价 函数 ， 然 后 推荐 系统 将 这 些 包含 限制 的 函数 进行 组 合 ， 为 每 个 属性 和 产品 计算 出 一 个 效用 
值 。 该 系统 展示 了 一 个 排序 后 的 拥有 最 高 效用 值 的 最 佳 产品 的 列表 。 当 用 户 改变 了 他 的 偏好 时 ， 
不 论 是 通过 添加 了 另外 一 个 评价 条 件 ， 还 是 改变 了 偏好 的 权重 ， 产 品 列表 都 会 被 重新 排列 。 


图 13.5 用 户 促 进 的 评价 接口 [9] 
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13. 3.2 基于 评价 的 推荐 系统 中 的 检索 挑战 


与 使 用 的 评价 (单个 /复合 ) 的 类 型 或 者 生成 评价 的 方法 (比如 ， 固 定 对 应 动态 ， 系 统 提议 
与 用 户 促进 ) 无 关 ， 推 荐 是 否 成 功 很 大 程度 上 受用 户 评 价 行为 的 影响 。 如 上 所 述 ， 用 户 可 能 
太 过 侧重 于 一 个 特征 ， 导 致 推荐 出 来 的 产品 并 不 满足 他 们 所 指定 的 其 他 特征 [39]。 然 而 ， 几 
乎 没有 什么 策略 来 控制 用 户 如 何 选择 使 用 评价 标准 ， 为 了 提高 推荐 的 效果 ， 只 有 尽量 减少 检 
索 的 挑战 。 在 本 节 ， 我 们 概述 了 以 上 一 些 问 题 ， 并 简要 地 讨论 了 已 经 被 解决 的 问题 。 
13.3.2.1 偏好 的 易 变性 与 生存 期 

FindMe 系统 中 的 偏好 模型 是 一 个 特征 向 量 ， 从 用 户 最 初 高 级 特征 限制 的 实例 中 获得 。 
使 用 一 个 评价 会 用 最 近 特 征 评价 来 更 新 这 个 模型 ， 并 且 会 临时 将 那些 不 满足 评价 条 件 的 餐馆 
从 推荐 候选 集中 删除 。 然 后 ， 这 些 经 过 筛选 之 后 的 餐馆 会 被 按 用 户 的 偏好 进行 分 层 排序 。 

如 在 13.2 节 所 提 到 的 ， 不 能 指望 用 户 在 推荐 会 话 过 程 中 能 提供 一 致 的 反馈 。 传 统 的 
基于 评价 的 推荐 系统 (如 RentMe，Entree) 注 重 于 当前 评价 和 推荐 ， 并 不 考虑 过 往 所 选择 
的 评价 ， 这 同样 会 导致 检索 失败 。 许 多 用 户 在 推荐 会 话 刚 开 始 时 ， 不 会 对 自己 的 需求 有 一 
个 很 清楚 了 解 。 这 就 导致 用 户 为 了 绘制 出 一 个 关于 可 用 产品 的 清晰 图 像 ， 在 会 话 中 会 选择 
明显 不 同 的 评价 选项 来 探索 各 种 不 同 的 产品 空间 的 领域 。 例 如 ， 我 们 可 能 会 发 现 ， 在 某 个 
周期 中 ， 一 个 用 户 开 始 想 要 买 比 当前 所 推荐 的 售 价 为 500 元 的 相机 便宜 的 数码 相机 ， 随 后 
又 要 求 找 比 另外 一 个 推荐 出 的 售 价 500 元 的 相机 贵 的 数码 相机 。 

Apt Decision 系统 [64] 维 护 着 更 灵活 的 关于 用 户 评 价 的 偏好 模型 ， 该 模型 和 其 他 模型 
的 区 别 在 于 ， 该 模型 将 正 偏好 模型 和 负 偏 好 模型 进行 了 分 离 ， 并 人 允许 用 户 可 以 对 其 进行 访 
问 。 此 系统 还 支持 基于 偏好 的 部 分 比较 ， 以 收集 更 多 潜在 的 偏好 信息 ， 并 添加 到 模型 中 。 
Shearin 和 Lieberman 认为 学 习 一 个 精准 的 用 户 属性 比 尝试 基于 限制 的 用 户 偏好 搜索 空间 
的 方式 要 更 有 利 [64]。 如 果 搜 索 空间 被 过 度 限制 ， 用 户 将 不 会 察觉 到 存在 一 些 潜在 选项 ， 
包含 他 们 可 能 愿意 折 中 的 特征 。 相 反 ， 宽 松 的 约束 允许 用 户 更 多 地 探索 产品 空间 ， 让 推荐 
系统 有 机 会 获得 更 多 的 用 户 偏好 ， 并 更 好 地 进行 推荐 。 

SmartClient 系统 也 将 使 用 评价 表示 用 户 显 性 偏好 。 两 者 都 选用 了 受 约束 的 解决 方式 
来 获得 最 佳 的 解决 方案 。 评 价 形式 的 用 户 偏好 被 建 模 成 CSP 形式 的 约束 。 使 用 一 个 代理 
程序 不 断 地 观察 用 户 对 偏好 的 修改 ， 然 后 改善 启发 模型 以 提高 准确 度 。Zhang 和 Pu[ 73] 
描述 了 一 个 MAUT 偏好 模型 ， 用 于 调整 基于 用 户 评价 反馈 的 效用 ， 然 后 就 能 检索 出 最 大 
化 偏好 效用 的 推荐 。 相 似 地 ，Chen 和 Pu[12] 描 述 了 一 个 MAUT 偏好 建 模 方法 ， 让 用 户 
能 通过 直接 操作 评价 标准 来 指明 他 们 的 权衡 。 

Reilly 等 的 增 量 评价 [58] 方 法 ， 维 护 了 一 个 组 成 真实 评价 的 用 户 偏好 模型 ， 到 目前 为 
止 仍 被 用 户 使 用 着 。 解 释 这 种 情况 的 直觉 是 ， 被 沿用 至 今 的 评价 代表 了 演变 着 的 用 户 需 
求 。 为 了 保持 用 户 模型 的 准确 度 ， 去 掉 了 相互 矛盾 的 评价 ， 正 如 所 有 现存 的 评价 中 的 最 近 
评价 是 经 过 精 选 的 。 在 检索 推荐 时 ， 待 选项 的 优先 顺序 应 该 满足 : 1) 符 合 当 前 的 评价 ; 
2) 与 之 前 的 推荐 相似 ; 3) 满 足 大 多 数 之 前 的 评价 。 9 给 定 两 个 与 之 前 推荐 同样 相似 的 候选 
项 ， 他 们 的 算法 更 倾向 于 选择 与 最 近 大 量 的 选择 保持 一 致 的 评价 ， 例 如 ， 那 些 返回 更 高 通 


O ”在 这 种 做 法 中 ， 他 们 显 式 地 将 用 户 模型 中 过 往 的 评价 作为 软 限制 ， 用 来 在 之 后 的 推荐 周期 中 进行 限制 ;在 
推荐 中 ， 满 足 所 有 之 前 的 评价 并 不 重要 ， 但 是 能 满足 更 多 的 评价 的 更 能 作为 推荐 待 选项 。 
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用 性 分 数 的 选项 。 结 果 就 是 ， 能 够 减少 近 70%% 的 会 话 长 度 [58]。 

最 后 ，Nguyen 和 Ricci 最 近 推 动 了 维护 可 替换 的 偏好 模型 的 需求 ， 用 来 区 分 长 期 的 和 
特定 会 话 的 用 户 偏好 。 他 们 提出 了 一 个 方法 来 整合 这 两 种 偏好 信息 ， 用 于 生成 个 性 化 的 推 
荐 [41]。 特 定 会 话 的 偏好 ， 包 括 上 下 文 偏好 与 产品 特征 偏好 。 上 下 文 偏好 ， 比 如 ， 一 个 餐 
馆 在 某 时 间 开 张 或 位 于 用 户 附 近 ; 产品 特征 偏好 ， 比 如 ， 便 宜 的 中 国 饭 馆 。 长 期 用 户 偏好 
[44] 是 指 关 于 用 户 的 那些 相对 能 维持 很 长 一 段 时 间 的 信息 ， 比 如 ， 多 个 连续 的 推荐 会 话 。 
这 些 偏 好 通常 在 注册 的 时 候 引 出 ， 并 在 之 后 使 用 系统 的 过 程 中 被 修订 。 
13.3.2.2 减少 的 与 不 可 达 的 选项 


如 上 所 述 ， 早 期 基于 评价 的 推荐 系统 用 评价 选项 作为 产品 选项 的 临时 过 滤器 ， 并 且 作 为 进 













一 步 的 考虑 ， 对 所 有 被 评价 的 推荐 进行 缩减 。McSherry 与 Aha 发 现 了 一 个 关于 减少 选项 问题 
[40] 的 潜在 缺点 。 他 们 认为 ， 当 仅 有 的 一 个 可 以 为 用 户 推 荐 的 产品 ， 且 这 个 产品 是 他 们 已 经 评 
价 过 的 产品 ， 而 为 了 防止 返回 他 们 已 经 评价 过 的 产品 ， 这 个 产品 也 会 被 排除 ， 那 么 就 会 出 现 检 
索 失 败 的 情况 。 他 们 展示 了 一 个 例子 (图 13. 7) ， 如 果 展 示 给 用 户 一 个 实例 1( 比 如 ， 有 一 个 在 地 
址 A 的 3 间 单 独 卧室 的 房产 ) 。 假 设 用 户 喜 欢 在 指定 地 方 的 有 4 间 单 独 卧 室 的 房产 。 假 设 那 些 
特征 具有 同样 的 权重 ， 两 个 实例 的 相似 度 取 决 于 匹配 的 特征 数量 ， 基 于 卧室 特征 (比如 ， 床 的 数量 
大 于 某 值 ) 的 评价 可 以 预见 该 用 户 会 选择 实例 2。 如 果 没 有 一 种 情况 能 满足 用 户 所 有 的 需要 ， 他 们 
就 会 重新 评估 实例 1， 但 是 实例 1 已 经 被 移 除 ， 所 以 他 们 只 能 考虑 实例 3， 或 者 重新 开始 推荐 的 
LE [Eee] [Beas] | [ye] 
[实例 2] || B || 4 [|| aec] A 3 det B 4 det A 3 sem 
ED 
13.7 显示 减少 选项 问题 ， 导 致 减少 评价 推荐 问题 的 结果 [40] 
相反 ， 不 可 达 问 题 [40，18j] 是 指 没有 对 之 前 的 推荐 进行 排除 。 在 [40] 引 用 中 ，McSherry 和 
Aha 也 提出 这 种 情况 可 能 会 存在 导致 满足 用 户 需 求 的 产品 (如 果 有 ) 始 终 都 不 会 被 检索 出 来 。 这 
个 问题 在 图 13. 8 中 很 好 地 进行 了 展示 ， 将 选项 分 好 类 之 后 按 顺 序 推荐 给 用 户 时 ， 第 4 个 评价 将 
用 户 带 回 了 最 初 的 推荐 ， 而 没有 展示 出 实例 5。 这 里 的 一 个 重点 是 ， 该 例子 里 的 推荐 检索 只 被 
最 近 选 择 的 评价 所 影响 ， 即 最 初 的 查询 条 件 以 及 其 他 之 前 的 所 选择 的 评价 并 没有 被 考虑 到 。 
T et 
E 
| 实例! | Cae e 
[5 ] Lone; 更 多 床 
B 3 sem3 B 4 sem2 
图 13.8 显示 不 可 达 问 题 ， 其 导致 未 排除 被 评价 的 推荐 [40] 
McSherry 和 Aha[ 39] 描 述 的 Tweak 系统 实现 了 渐进 评价 方法 ， 类 似 增 量 的 评价 [58]， 解 决 
了 需要 维护 用 户 历史 评价 记录 的 问题 。 根 据 用 户 的 评价 检索 出 来 的 推荐 项 必须 同时 满足 历史 评 
价 和 最 初 的 查询 条 件 的 限制 。 图 13. 9 显示 了 一 个 推荐 选项 ， 满 足 了 一 组 用 户 的 当前 限制 ， 由 他 
们 初始 的 查询 条 件 ( 比 如 ， 制 造 商 于 Dell 同时 价格 二 1000) 和 历史 评价 (比如 ， 类 型 是 便携 式 电脑 
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且 屏 幕 尺 寸 小 于 某 值 ) 组 成 。 注 意 ， 类 型 是 便携 式 电脑 这 个 限制 条 件 ， 是 用 户 在 此 处 提供 的 仅 有 
条 件 ， 并 不 符合 当前 的 推荐 。 渐 进 评价 方法 检索 出 那些 与 当前 推荐 和 评价 最 相似 的 产品 ， 优 先 
处 理 那 些 在 偏好 模型 中 的 偏好 属性 。 该 模型 为 特征 值 记 录 了 明确 的 、 假 设 的 和 预测 的 偏好 。 这 
里 明确 的 偏好 是 指 那些 初始 查询 条 件 ， 并 随后 在 象征 性 的 特征 (例如 ， 类 型 是 便携 式 电脑 ) 上 作 
”为 替代 评价 应 用 。 假 设 的 偏好 是 指 那些 决策 性 的 偏好 ， 这 样 暗示 关系 的 偏好 特征 。 比 如 ， 在 价 

格 中 ,假设 越 少 越 好 (less-is-better，LIB) 可 能 是 理由 充分 的 ;又 如 ， 内 存 ， 可 以 假设 越 多 越 好 
(more-is-better，MIB) 。 预 测 的 偏好 是 指 那 些 用 户 趋 于 拥有 理想 值 的 特征 ， 并 且 偏 好 于 那些 接近 
于 理想 的 值 ， 如 越 接 近 越 好 (nearer-is-better，NIB)[37，35]。 


推荐 实例 


p 6 
















price=658 






图 13.9 展示 在 典型 渐进 评价 会 话 中 的 可 用 知识 ; 当前 推荐 、 当 前 查询 和 用 户 偏好 L39] 


与 增 量 的 评价 不 同 ，Tweak 系统 中 的 偏好 模型 针对 某 特征 的 最 新 评价 进行 修整 ， 与 此 
特征 上 的 历史 评价 没有 关联 。 比 如 ， 使 用 了 Sony 制造 的 评价 来 代替 Dell 制造 ， 就 是 在 偏 
好 模型 中 用 Sony 代替 了 Dell, X} NIB 特征 来 说 ， 预 测 的 偏好 值 要 是 最 接近 评价 的 推荐 项 
(比如 ， 一 个 小 于 某 屏 幕 值 的 评价 可 能 会 导致 屏幕 的 尺寸 值 设置 为 14)。 相 比 之 下 ， 增 量 的 
评价 导致 了 以 下 情况 : 在 一 系列 的 推荐 环节 中 ， 多 次 为 一 个 用 户 展示 一 些 关 于 Dell 的 选 
项 ， 然 后 用 户 选 择 了 这 些 选项 (比如 ， 它 们 更 优先 于 别 的 变化 的 评价 )。 增 量 的 评价 使 用 兼 
容 性 的 标准 来 衡量 每 个 候选 产品 与 当前 产品 的 相似 度 ， 以 及 其 能 满足 的 历史 评价 的 数量 。 
但 是 ， 这 里 潜在 的 一 个 问题 是 : 一 个 高 相似 度 的 产品 会 带 来 较 多 的 影响 ， 并 在 多 次 的 检索 
中 满足 较 多 的 评价 。 与 Nguyun 和 Ricci[41]、Salamo 等 [63] 类 似 ， 当 他 们 将 相似 度 作 为 
评价 推荐 的 第 二 检索 标准 时 发 现 了 该 问题 。 

与 Shearin 和 Lieberman[64] 一 致 的 是 ，McSherry 认为 用 户 应 该 可 以 理解 当前 系统 对 
用 户 偏好 的 分 析 方 法 ， 并 且 这 对 于 防止 所 谓 的 渐进 失败 特别 重要 。 比 如 ， 不 存在 一 个 产品 
能 满足 所 有 用 户 的 要 求 。 在 Shearin 和 Lieberman 的 Apt Decision 系统 中 ， 用 户 能 够 持续 
地 、 直 接地 访问 他 们 的 偏好 模型 。 同 时 这 让 用 户 对 为 何 会 检索 到 如 此 的 推荐 项 能 够 有 更 深 
层 的 理解 ， 但 是 仍然 会 产生 连 串 失败 。McSherry 选择 了 一 种 基于 解释 的 有 趣 方法 ， 当 所 
有 的 推荐 候选 项 都 不 满足 偏好 限制 时 ， 为 用 户 提供 可 能 适合 的 折 中 方案 及 其 解释 。 最 近 的 
演化 评价 算法 [40] 专 注 于 定位 不 可 达 问 题 。 这 种 演化 评价 实现 的 关键 不 同 点 在 于 之 前 推荐 
过 (如 评价 方式 ) 的 物品 不 被 删除 ， 这 点 与 增 量 的 方法 一 样 。 
13.3.2.3 改善 推荐 检索 过 程 

即使 大 多 数 像 QwikShop, EasyShop, CritiqueShop? Entrée, RentMe 等 基于 评价 
的 推荐 系统 专注 于 在 每 个 推荐 周期 中 只 展示 一 个 候选 项 ， 而 其 他 类 似 Apt Decision 和 
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MobyRek 等 系统 为 用 户 提供 了 多 个 推荐 项 以 供 选 择 。 优 化 推荐 的 候选 项 是 一 个 挑战 。 在 
该 领域 的 早期 工作 中 ， 介 绍 了 EntréeC 这 样 的 混合 推荐 系统 [5，6]， 将 协同 过 滤 ( 见 第 5 
章 ) 的 组 件 加 入 了 Entrée[7] 系 统 中 ,创建 了 基于 知识 的 /协同 的 串联 混合 。 像 Entrée 一 
样 ， 它 使 用 了 基于 用 户 所 表明 的 与 餐馆 相关 的 偏好 知识 来 进行 推荐 。 协 同 过 滤 被 用 来 对 基 
于 知识 的 推荐 系统 所 返回 的 推荐 项 的 排序 规则 进行 优化 。 在 这 里 使 用 串联 方式 的 关键 好 处 
是 比 类 似 加 权 混 合 的 方式 更 加 高 效 ， 后 者 需要 在 所 有 的 物品 上 进行 处 理 ， 而 前 者 的 第 二 步 
只 关注 那些 需要 进行 额外 辨别 的 物品 。 此 外 ， 串 联 的 方式 能 容忍 低 优先 技术 操作 所 产生 的 
噪声 数据 ， 而 高 优先 级 推荐 返回 的 结果 只 能 被 优化 不 能 撤销 。EntréeC 的 实验 表明 协同 过 
滤 确 实 能 提升 仅 靠 基于 知识 的 Entrée 系统 的 效果 。 在 文献 [6] 中 ，Burke 讨论 了 存在 于 可 
替换 推荐 的 技术 和 检验 之 间 的 权衡 ， 在 一 些 其 他 传统 的 混合 推荐 系统 中 被 使 用 的 结合 方 
法 ， 也 与 基于 评价 的 推荐 系统 有 关 ( 请 见 第 22 章 、 第 2 章 和 第 24 章 )。 

Faltings 等 [15] 讨论 了 在 评价 系统 中 关键 的 问题 是 如 何 设 计 出 最 好 的 帮助 用 户 发 现 他 
们 最 襄 欢 的 解决 方案 。 他 们 提出 了 两 个 关键 的 需求 : 1) 推 荐 的 项 必须 激励 用 户 表达 他 们 将 
来 的 偏好 (比如 ， 展 示 出 可 选 替换 的 范围 ); 2) 展 示 给 用 户 的 推荐 项 必须 包含 用 户 可 能 会 考 
虑 的 最 佳 解决 方案 (假如 ， 当 前 的 偏好 模型 是 完整 的 )， 故 用 户 能 选择 用 来 作为 最 终 的 解决 
方案 。 动 态 评价 的 方法 试图 通过 组 合 评价 的 方法 来 发 现 那些 能 引导 用 户 的 需求 。 但 是 ， 依 
人 靠 个 体 评价 的 系统 也 许 能 找到 它 所 提供 的 低 特征 级 别 的 反馈 ， 不 需要 充分 的 细节 就 能 明确 
地 专注 于 下 一 个 推荐 环节 [33]。 比 如 ， 推 荐 的 相机 拥有 更 高 分 辩 率 能 帮助 用 户 缩小 搜索 范 
围 ， 但 是 仍 有 可 能 导致 检索 出 大 量 的 推荐 候选 项 。 评 价 和 数值 启发 反馈 模式 (例如 ， 为 我 
展示 500 万 像素 的 相机 ) 就 能 更 有 效 地 降低 产品 选项 的 数量 。 

在 与 数值 启发 方式 比较 时 ，McGinty 和 SmythL32，33] 论 证 了 基于 评价 的 推荐 系统 在 
推荐 会 话 中 会 有 的 延迟 。 作 为 一 个 潜在 的 解决 方案 ， 他 们 提出 了 一 个 新 颖 的 切换 策略 ， 此 
策略 中 检索 模式 与 用 户 评价 行为 是 一 致 的 。 他 们 论证 了 自 适应 选择 策略 是 如 何在 标准 的 基 
于 相似 度 的 方法 和 和 多样 化 强化 检索 方式 的 基础 上 减少 了 60% 的 潜在 交互 。 

在 最 近 的 工作 中 ，Chen 和 Pu[9] 描 述 了 他 们 的 样 例 评价 的 方式 ， 他 们 发 现 用 户 的 偏 
好 通常 是 基于 上 下 文 的 。 从 其 中 展示 出 来 的 多 个 推荐 项 中 ， 用 户 选择 了 其 中 之 一 来 进行 评 
价 。 他 们 选用 了 一 种 基于 偏好 的 组 织 方式 [12] 来 推荐 最 高 效用 的 产品 ， 同 时 允许 用 户 在 多 
个 特征 上 自由 地 进行 组 合 评价 ， 此 方法 表示 用 户 希望 使 用 简单 或 者 复杂 度 折 中 的 选择 。 

13. 3.2.4 多 用 户 偏好 的 处 理 


为 一 群 用 户 推 荐 物品 有 很 多 的 挑战 (例如 ， 参 考 [3，47，24]， 以 及 第 22 章 、 第 18 
章 、 第 21 章 和 第 16 章 )。Jameson 在 这 个 领域 中 的 早期 工作 [20]， 重 点 提出 了 一 些 难 点 
( 简 述 见 图 13. 10)， 并 且 描 述 了 在 一 组 原型 推荐 系统 上 下 文中 如 何 处 理 : 旅游 决策 论坛 
(Travel Decision Forum) 。 这 些 系统 也 和 单 用 户 的 推荐 系统 有 同样 的 问题 (比如 ， 偏 好 的 
不 一 致 、 发 散 性 )， 以 及 其 他 的 关键 区 分 特点 ， 包 括 促 进 组 成 员 之 间 偏 好 的 相互 了 解 并 达 
成 共识 (参考 13.4 节 ， 交 流 交互 如 何在 这 里 扮演 了 一 个 重要 的 角色 )。 生 成 一 些 能 让 多 用 户 感 兴 
趣 的 推荐 项 集合 本 身 就 是 有 挑战 的 ， 更 多 的 挑战 是 如 何在 多 用 户 人 参与 实时 同步 的 推荐 会 话 中 记录 
并 组 合 这 些 偏好 [29]， 并 处 理 其 中 的 冲突 。 这 里 的 关键 目标 问题 是 ，1) 如 何 管理 多 用 户 交互 ， 并 进 
一 步 从 多 个 同时 使 用 的 用 户 中 收集 反馈 和 偏好 ? 2) 如 何 动态 地 维护 个 人 和 组 的 偏好 模型 ， 使 得 结 
果 能 有 可 能 同时 满足 单个 和 组 的 用 户 ? 

McCarthy 等 最 近 的 工作 [29，31] 集 中 在 基于 评价 的 组 推荐 架构 中 如 何 使 偏好 聚合 并 
达成 共识 。 他 们 介绍 了 协作 咨询 旅游 系统 (Collaborative Advisory Travel System， 


第 13 章 ”基于 评价 推荐 系统 的 进展 293 


CATS)， 此 系统 被 设计 用 来 为 一 群 一 起 要 在 滑雪 度假 计划 上 达成 共识 的 朋友 提供 帮助 。 该 
系统 通过 同时 使 用 动态 单元 、 组 合 评价 、 单 用 户 和 多 用 户 的 偏好 模型 来 提供 单 用 户 和 多 用 
户 的 反馈 模型 。 合 理 的 假设 是 : 单个 用 户 在 使 用 这 种 系统 的 时 候 ， 在 看 了 同 组 其 他 人 的 反 
馈 之 后 ， 可 能 需要 重复 查看 之 前 的 推荐 项 。 比 如 ， 一 个 用 户 选择 了 在 节假日 的 开销 上 进行 
妥协 ， 那 么 之 后 其 他 同 组 的 成 员 可 能 也 会 这 样 做 .CATS 通过 促进 生成 主动 和 被 动 推 荐 来 
提供 以 上 描述 的 功能 。 被 动 推荐 是 指 那些 展示 给 单个 用 户 的 建议 ， 是 根据 个 人 的 用 户 模型 
所 产生 的 评价 做 出 的 相应 反应 。 相 反 ， 主 动 推荐 是 指 由 系统 自动 为 群 组 生成 满意 度 非常 高 
的 群 组 偏好 的 推荐 候选 项 ; 此 处 没有 考虑 的 是 ， 单 个 的 组 成 员 可 能 之 前 拒绝 过 这 个 推荐 
Jb. 另外， 组 成 员 也 能 为 系统 辨别 出 哪些 推荐 候选 项 是 整个 群 组 的 潜在 偏好 。 偏 好 模型 中 
的 偏好 不 一 致 可 以 通过 增 量 评价 方法 来 处 理 。 组 模型 在 生成 推荐 项 时 可 能 包含 一 些 冲突 的 
偏好 和 目标 ， 这 些 不 一 致 被 最 小 化 ， 以 便 最 大 化 地 兼容 多 用 户 的 偏好 。 


来 自 单个 成 员 的 推荐 的 差异 


组 成 员 可 能 想 要 查看 其 他 每 个 成 员 的 
偏好 说 明 
必须 应 用 一 个 偏好 聚合 程序 
单个 成 员 解决 方案 〈 可 能 不 同 ) 的 适 
用 性 成 为 整个 解决 方案 的 重要 层面 
最 终 决定 不 必 由 一 个 人 决定 ; 需要 达 
成 共识 











新 问题 
这 个 研究 的 优 缺 点 是 什么 ， 以 及 系 
统 如 何 支持 
聚合 过 程 怎样 有 效 地 阻止 人 为 操纵 
的 偏好 说 明 
与 单个 成 员 相关 的 适用 性 如 何 有 效 
展示 
当 组 成 员 无 法 参与 面对面 讨论 时 ， 
系统 怎样 支持 得 出 最 终结 论 的 过 程 










推荐 过 程 阶段 
1. 组 成 员 指定 他 们 的 偏好 














2. 系统 生成 推荐 









3. 系统 将 推荐 展示 给 组 成 员 






4. 组 成 员 决 定 接受 哪个 推 
F GIRA) 





Fd 13.10 ”Jameson[20] 所 简 述 的 面 对 组 推荐 架构 时 的 挑战 


据 我 们 所 知 (在 我 写本 书 的 时 候 ) ， 并 没有 其 他 在 基于 评价 的 推荐 领域 中 的 工作 是 专注 
于 多 用 户 偏 好 的 建 模 的 。 但 为 了 完整 性 ， 我 们 描述 了 与 典型 的 ( 非 基 于 评价 ) 组 推荐 的 比 
较 。 包 括 存 在 的 多 用 户 的 协商 应 用 ， 覆 盖 了 虚拟 环境 [50] 和 真实 环境 [16]。 在 大 部 分 这 些 
系统 中 假设 了 一 个 自动 协商 机 制 ， 它 以 系统 中 的 现 有 的 静态 个 体 偏好 模型 为 基础 。CATS 
系统 的 实时 交互 特性 不 适合 使 用 静态 的 偏好 模型 。 在 CATS H, 个体 偏好 模型 很 容易 受 多 
用 户 反 馈 的 影响 而 趋 于 多 变 。 其 他 组 推荐 领域 的 研究 中 包括 MusicFX 系统 [25]。Mnu- 
sicFX 是 一 个 组 偏好 模型 推荐 系统 ， 自 适应 选择 播放 的 音乐 来 最 好 地 满足 那些 处 于 相同 环 
境 中 的 群 组 的 音乐 品味 。PolyLens[46] 是 MovieLens 的 一 个 泛 化 版 本 ， 其 通过 偏好 建 模 来 
给 群 组 用 户 推荐 电影 。 相 反 地 ， 它 还 提取 了 相似 上 下 文中 的 用 户 历史 音乐 偏好 记录 来 进行 
协同 过 滤 。 类 似 于 CATS， 旅 游 决 策 系统 (Travel Decision Forum)[20] 帮 助 一 组 用 户 在 共 
同 的 假期 出 游 上 达成 一 致 。 但 是 ， 它 致力 于 帮助 那些 不 在 同一 个 地 方 的 用 户 。 在 其 他 相关 
的 工作 中 ，Plua 和 Jameson[49] 提 出 了 一 个 方法 ， 使 得 那些 用 户 即使 对 相关 领域 知识 了 解 
不 太 全 面 ， 也 能 从 其 他 同 组 用 户 那里 获得 帮助 。 与 CATS 不 同 ， 这 个 系统 为 一 个 群 组 提供 
异步 的 交互 ， 而 不 是 同步 的 交互 。 


13.4 评价 平台 中 的 交互 研究 


在 根据 不 同 领域 和 平台 的 特征 为 其 设计 推荐 的 交互 接口 时 ， 设 计 者 面临 着 具有 差异 的 
技术 和 适用 性 的 挑战 。 本 节 专 注 于 在 现 有 的 基于 评价 的 推荐 系统 中 如 何 设计 决策 系统 的 
( 见 第 16 章 ) 。 训 无 疑问 ， 一 个 共同 的 问题 是 如 何 能 将 用 户 对 系统 的 认 知 透明 度 和 操控 深 
度 权衡 好 ， 保 证 最 小 化 用 户 认 知 程度 和 交互 负担 。 
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13. 4. 1 扩展 到 其 他 评价 平台 


即使 当前 大 部 分 基于 评价 的 推荐 系统 是 基于 网 页 的 桌面 平台 (如 FindMe # HE. QuickShop, 
EasyShop、CritiqueShop、AptDecision、SmartClient) ， 评 价 策略 在 其 他 平台 中 也 可 以 被 论证 为 一 
种 有 效 的 交互 方法 。 比 如 ，Ricci 和 Nguyen[61，43，62] 专 注 于 移动 设备 上 的 推荐 交互 设计 和 评 
估 。 他 们 指出 只 有 很 少 为 移动 用 户 设计 的 基于 网 页 的 推荐 系统 ， 而 且 这 些 推荐 系统 没有 一 个 具 
有 交互 功能 。 持 久 的 直接 操作 在 这 里 是 不 实际 的 。 关 键 的 挑战 包括 : 这 种 设备 只 有 很 小 的 屏幕 
尺寸 ， 比 传统 的 PDA 设备 (比如 ，Palm/ 奔 迈 或 掌上 电脑 ) 拥 有 更 少 的 键盘 功能 ， 并 且 也 只 有 有 
限 的 计算 能 力 。 他 们 的 MobyRek 移动 交互 界面 以 及 基于 网 页 的 推荐 系统 用 于 帮助 用 户 提 前 制订 
旅游 计划 。 重要 的 是 ，MobyRek 能 为 已 经 上 路 甚至 已 经 到 达 了 目的 地 的 用 户 提供 及 时 的 支持 。 

在 移动 的 领域 中 ， 图 13. 11 显示 了 CritiqueShop 的 交互 接口 是 如 何 扩展 到 iPhone 上 
的 。 影 响 设计 的 主要 考虑 因素 包括 有 限 的 屏幕 区 域 和 更 多 用 户 直 接 操作 机 会 ( 记 住 iPhone 
有 一 个 触摸 的 界面 ) 。 这 里 提出 了 另外 一 个 设计 方法 ， 其 移 除 了 基于 文字 的 组 合 评价 的 展 
示 方 式 ， 而 转向 展示 更 多 可 视 的 替代 选项 (之 后 会 进行 讨论 ) 。 





两 个 推荐 选项 的 预 确认 选择 
-图 13. 11 CritiqueShop 的 iPhone 可 视界 面 截图 [www. critiqueshop. com] 
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图 13. 12 演示 DiamondTouch 系统 的 CATS 互动 


在 其 他 的 工作 中 ，McCarthy 等 L30] 论 述 了 CATS 的 群 组 推荐 系统 是 如 何在 多 用 户 
MERL 的 DiamondTouch9 平 板 设 备 上 进行 交互 操作 的 ~ DiamondTouch 平板 是 一 个 多 用 
户 的 触摸 -手势 触发 的 屏幕 ， 为 一 个 组 提供 协作 操作 。 用 户 同 时 与 界面 进行 交互 ， 浏览 潜 
在 的 滑雪 度假 选项 和 返回 的 评价 推荐 (比如 ， 之 前 提 到 的 推荐 项 不 断 受 到 个 体 变化 的 兴趣 
和 其 他 群 组 成 员 的 评价 模式 的 影响 )。 此 处 用 户 还 能 为 其 他 用 户 展 示 潜 在 感 兴趣 的 选项 ， 
就 像 根 据 自己 的 偏好 面对面 地 为 他 们 提供 推荐 ， 只 是 使 用 了 不 寻常 的 交互 行为 。 


13.4.2 用 户 直 接 操作 与 限制 用 户 控制 的 比较 


影响 评价 交互 方式 设计 的 一 个 基本 考虑 因素 是 ， 在 启发 精准 的 偏好 信息 以 及 获取 到 该 
信息 所 需 的 相关 代价 之 间 找 到 平衡 点 。 早 期 的 基于 评价 的 推荐 系统 提供 了 非常 严格 的 用 户 
控制 方法 (比如 ， 展 示 了 静态 的 评价 ， 并 且 用 户 只 能 选择 其 中 之 一 )。 之 后 的 系统 ， 如 
QwikShop, EasyShop 和 CritiqueShop， 通 过 可 替换 (单个 /组 合 ) 的 评价 选择 模式 为 用 户 提 
供 了 更 多 的 自助 可 控 性 ， 但 不 允许 用 户 直 接 修改 他 们 的 偏好 模型 (如 Apt Decision), BA 
在 确切 的 特征 上 设置 明确 约束 的 边界 (如 类 似 SmartClient 的 情况 ) 。 

Chen 和 Pu[L11] 演 示 了 他 们 的 混合 交互 界面 是 如 何 同时 支持 用 户 驱 动 和 系统 驱动 的 评价 ， 
并 且 让 用 户 能 达到 更 高 的 决策 准确 度 和 交互 满意 度 ， 同 时 比 系统 建议 的 评价 交互 方式 需要 更 
少 的 认 知 。 为 了 替代 计算 出 推荐 项 之 后 让 用 户 选择 的 方式 ， 自 驱动 的 评价 方式 专注 于 展示 样 
例 和 激励 用 户 按 照 他 们 自己 所 希望 的 那样 对 任意 的 特征 进行 组 合 ， 从 而 进行 单独 的 或 组 合 的 
评价 选择 。 重 要 的 是 ， 在 关于 个 体 特征 的 改进 和 妥协 上 ， 用 户 还 应 能 自由 地 描述 他 们 的 折 中 
标准 ， 并 且 看 到 更 加 接近 他 们 理想 选择 的 一 组 新 产品 ( 见 图 13. 5)。McSherryL38j 在 进化 的 评 
价 推荐 系统 中 寻找 一 种 折 中 方案 ， 除 了 系统 生成 的 松弛 机 制 ， 可 以 引入 直接 的 概念 和 源 于 用 
户 动机 的 松弛 评价 。Tweak2 系统 实现 了 这 个 混合 主动 的 方法 ， 人 允许 用 户 请 求 一 个 像 当 前 推 
荐 项 的 物品 ， 但 是 在 他 们 选择 的 特殊 (之 前 评价 过 的 ) 特 征 上 没有 对 选项 的 值 进行 限制 。 

移动 平台 为 用 户 提 供 了 非常 有 限 的 控制 许可 [42]。 此 外 ， 电 信服 务 的 花 销 倾向 于 不 鼓 
励 用 户 参 与 较 长 时 间 交 互 的 会 话 。 在 这 里 ， 通 常用 点 击 次 数 、 翻 页 次 数 、 键 盘 操 作 次 数 和 
用 户 需 要 进行 操作 的 次 数 来 衡量 效率 。 由 于 要 保持 低 的 消耗 (时 间 和 金钱 ) ， 往 往 需要 牺牲 
用 户 的 可 操作 性 。 在 MobyRek 系统 中 ， 影 响 评 价 是 否 被 采纳 为 合适 的 直接 反馈 机 制 有 两 
个 关键 的 要 求 : 1) 需 要 在 非常 小 的 屏幕 区 域 中 获得 有 用 的 偏好 信息 ; 2) 用 户 系统 的 交互 必 


Q  DiamondTouch 的 产品 线 从 MERL 研究 实验 室 移 到 了 名 为 Circle Twelve 的 一 个 独立 公司 。 
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须 是 低 消 耗 的 ;就 是 说 需要 在 最 短 的 时 间 内 获得 有 用 的 推荐 。 评 估 显 示 通 常会 在 2 一 3 个 
周期 /点 击 之 内 [42，61] 为 用 户 推荐 可 以 接受 的 选项 ” 。 


13.4.3 支持 性 解释 、 置 信和 信任 


本 手册 中 有 很 多 章节 与 该 标题 相关 (以 第 20 章 、 第 14 章 、 第 15 章 、 第 16 章 和 第 25 章 
为 例 )。 推 荐 系统 建立 与 用 户 之 间 的 信任 并 能 用 推荐 项 来 说 服 他 们 (就 像 购买 哪个 相机 、 个 人 
电脑 ) 的 能 力 是 一 个 至 关 重 要 的 设计 因素 [51，52]。 如 果 用 户 意识 到 这 个 系统 能 协助 他 们 做 
决定 ， 那 么 他 们 就 更 有 可 能 会 再 次 使 用 这 个 系统 。 研 究 者 通过 为 用 户 解释 推荐 项 的 来 源 ， 实 
现在 基于 评价 的 推荐 系统 中 建立 信任 的 设计 原则 和 策略 (例如 ，[52，57，66])。 通 常 ， 推 荐 
一 个 产品 推荐 系统 可 能 要 解释 : 1) 为 什么 这 个 特殊 的 产品 会 被 推荐 (或 不 被 推荐 )[36]; 2) 存 
在 什么 样 的 时 机 :“ 我 可 以 从 这 里 到 哪里 去 ”， 什 么 时 候 会 展示 不 合适 的 推荐 项 [57]。 在 第 一 
个 例子 中 ， 为 什么 产品 会 被 推荐 出 来 ， 能 够 很 容易 地 通过 为 用 户 显 示 用 户 模型 中 的 信息 来 解 
释 ， 正 如 Apt Decision 系统 中 合理 的 解释 方法 [66]( 见 图 13. 6)。McSherry[36，37] 强 调 当 推 
荐 结果 不 满足 用 户 需求 时 ， 解 释 检 索 失 败 原 因 的 重要 性 。 他 描述 了 一 个 混合 主动 的 方法 ， 通 
过 对 不 满足 查询 条 件 的 检索 的 特征 进行 突出 标记 (比如 ， 没 有 低 于 300 欧元 且 分 辨 率 高 于 400 
万 像素 的 相机 )， 让 用 户 能 够 修改 他 们 的 限制 条 件 ， 以 便 从 检索 失败 的 情况 下 进行 恢复 。 





' Æ 13.13 MobyRek 移动 端 餐馆 推荐 系统 [61] 

Reilly 等 [57] 讨 论 了 动态 的 组 合 评价 能 帮助 用 户 对 各 种 特征 之 间 的 共同 交互 进行 辨别 ( 比 
如 ， 通 过 提升 系统 的 透明 性 来 进行 解释 [66])， 从 而 更 好 地 理解 存在 于 当前 推荐 环节 的 推荐 时 
机 。 在 一 些 推荐 领域 中 ， 用 户 通常 都 不 会 对 各 种 特征 的 细节 有 比较 完整 的 理解 ， 所 以 组 合 评价 
能 够 帮助 更 有 效 地 标 出 这 个 空间 ， 并 将 决策 的 错误 降 到 最 低 。 比 如 ， 在 数码 相机 领域 中 的 标准 
评价 中 ， 用 户 可 能 很 简单 地 选择 小 于 某 价格 的 单个 评价 ， 并 错误 地 认为 能 得 到 一 些 比 所 指定 的 
价格 低 ， 且 满足 他 们 其 他 所 有 要 求 的 相机 。 但 是 ， 用 这 种 方式 来 降低 价格 可 能 会 导致 检索 到 一 
些 分 辩 率 不 能 满足 用 户 需 求 的 相机 ， 结 果 就 是 ， 用 户 需 要 返回 去 重新 进行 检索 。Hadzic 和 
O’ Sullivan[18j] 强 调 了 一 个 更 深层 的 潜在 问题 ,评价 的 不 对 称 对 用 户 来 说 可 能 有 悖 常理 。 所 以 ， 
想 要 撤销 一 个 评价 并 不 能 单 靠 点击 浏览 器 的 回 退 按钮 来 实现 。 但 是 这 种 问题 在 组 合 评价 (价格 小 


O 目的 是 评估 一 个 移动 平台 的 餐馆 应 用 ， 使 用 蓝牙 连接 的 GPS 接收 器 来 收集 位 置信 息 。 
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于 ,分 辩 率 小 于 ) 中 并 不 容易 出 现 ， 因 为 用 户 在 选择 评价 之 前 会 对 价格 下 降 所 产生 的 影响 有 所 了 
解 。 另 外 ，QwikShop 在 界面 上 预 留 了 一 个 区 域 来 提供 额外 的 解释 。 用 户 还 能 得 到 一 些 信 息 : 与 
每 个 展示 的 评价 选项 相关 的 产品 数 ， 每 个 选项 的 特征 的 值 的 范围 ， 见 图 13. 2。 

通过 解释 来 提供 系统 的 透明 度 ， 让 用 户 更 加 有 把 握 地 去 评估 系统 的 可 靠 性 (比如 ， 提 升 用 
户 的 信任 )。 系 统 置信 度 是 对 解释 的 一 种 补充 。 为 了 在 推荐 中 最 大 化 用 户 的 信任 ， 系 统 本 身 就 应 
该 能 够 在 推荐 中 评估 自 有 的 置信 度 (或 缺少 置信 度 )。Reilly 等 [59] 提 出 了 一 个 系统 级 别 的 对 置信 
度 进行 建 模 的 方法 ， 用 于 基于 评价 的 推荐 系统 中 。 用 户 通 过 推荐 系统 在 推荐 过 程 中 的 置信 和 度 ， 
来 判断 是 否 相信 推荐 结果 。 他 们 提出 了 一 个 由 反馈 来 影响 的 模型 ， 该 模型 在 特征 和 产品 两 个 级 
别 上 对 系统 的 置信 度 标准 进行 了 计算 。 例 如 ， 一 个 在 价格 特征 上 较 低 的 系统 置信 度 分 数 ， 可 以 
理解 为 当前 推荐 的 重心 集中 在 为 用 户 提供 正确 的 价格 范围 时 ， 系 统 会 不 确定 其 推荐 的 物品 是 否 
是 可 信 的 。 一 旦 用 户 对 这 些 特 征 有 了 更 清楚 的 理解 ， 他 们 可 能 更 倾向 于 重新 调整 他 们 的 反馈 ( 比 
如 ， 优 化 和 改进 他 们 的 偏好 模型 )。 为 了 指导 推荐 系统 能 够 做 出 更 加 让 人 信任 的 建议 ， 作 者 还 演 
示 了 产品 级 别 的 置信 度 分 数 是 如 何 对 现存 的 相似 度 知识 进行 补充 的 。 


13.4.4 可 视 化 、 自 适应 性 和 分 区 动态 性 


第 17 章 强调 了 在 产品 推荐 系统 中 使 用 可 视 化 界面 的 好 处 ， 本 节 专 注 基于 评价 的 产品 推荐 
ARG. Zhang 等 L[72] 介 绍 了 一 个 使 用 有 意义 的 图 标 来 代替 文字 表示 的 组 合 评价 的 可 视 化 界面 。 
图 13. 14 展示 了 一 个 简单 的 组 合 评价 是 如 何 使 用 这 两 种 方式 来 进行 展示 的 。 其 研究 表明 ， 用 户 
更 乐于 选择 可 视 化 的 组 合 评价 ， 而 不 是 文字 形式 的 组 合 评价 (可 视 化 方式 的 选项 被 选择 的 频率 比 
文字 的 增加 大 约 50%)， 并 且 随 后 的 好 处 是 还 降低 了 交互 的 时 间 ( 会 话 时 长 降低 大 约 53%% 六 。 
13. 11 显示 了 Zhang 等 是 如 何 通过 操作 iPhone 提出 了 可 视 化 的 界面 。 


组 合 评价 
CERD re E ef E z Cf ici ms 
图 13.14 演示 了 简单 的 组 合 评价 文字 和 可 视 化 表示 方式 [72] 


其 他 研究 显示 了 ， 支 持 根据 用 户 评价 的 反馈 来 动态 改变 界面 图 标的 自 适 应 的 可 视 化 界 
面 的 威力 。 特 别提 到 的 是 ，Averjanova 等 [2] 描 述 在 MobyRek 推荐 系统 [61] 中 ， 通 过 基于 
地 图 的 (map-based) 可 视 化 界面 ， 能 将 推荐 效率 (比如 ， 平 均 会 话 时 长 减少 17%) 和 用 户 满 
意 度 提高 。 类 似 地 ，CATS 群 组 推荐 系统 的 可 用 性 研究 显示 了 动态 自 适应 界面 [30]， 促 进 
了 改变 多 用 户 偏 好 时 彼此 间 的 互相 感知 。 两 个 系统 共有 的 一 个 关键 的 设计 性 考虑 是 如 何 最 
好 地 定位 推荐 结果 上 受 限 的 评价 影响 的 问题 ， 这 个 问题 导致 了 用 户 很 难看 到 评价 的 效果 。 
在 上 面 提 到 的 两 个 系统 中 ， 该 问题 是 通过 真实 用 户 的 可 用 性 评估 被 发 现 的 ， 虽然 用 的 是 动 
态 界面 的 组 件 ( 比 如 ， 改 变 图 标 大 小 和 颜色 编码 的 推荐 方式 )， 但 是 在 两 个 系统 中 定位 到 该 
问题 的 方式 却 非常 相似 。 例 如 ， 在 CATS 中 ， 如 果 一 个 特别 的 常 去 的 度假 地 点 的 兴趣 级 别 
在 一 个 群 组 中 都 非常 高 ， 那 么 这 个 度假 地 点 的 显示 尺寸 就 比 其 他 低 兴 趣 级 别 的 要 大 。 
MobyRek 界面 早期 的 用 户 报 告 了 另外 一 个 所 关心 的 问题 是 对 距离 的 察觉 ， 对 用 户 来 说 ， 


日 在 操作 笔记 本 电脑 数据 集 上 ， 用 一 个 版 本 的 系统 收集 数据 的 结果 。 
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在 移动 中 比较 餐馆 和 当前 用 户 的 位 置 非常 难 。 在 修改 的 MapMobyRek 系统 中 进一步 的 扩 
展 包 括 一 个 基于 地 图 的 界面 用 来 处 理 这 个 问题 。 其 他 的 扩展 包括 颜色 编码 ， 用 来 展示 推荐 
”的 适合 程度 ， 以 及 提供 物品 逐个 比较 的 功能 。 





13.15 演示 了 MapMobyRek 移动 端 推荐 系统 的 可 视 化 界面 


类 似 于 MobyRek, CATS 实现 了 一 个 基于 地 图 的 界面 ， 但 是 一 个 额外 的 设计 考虑 是 
如 何 最 好 地 表达 所 有 组 成 员 达 成 一 致 的 进度 。 该 功能 可 以 通过 使 用 高 可 视 化 的 颜色 编码 的 
一 致 性 指示 器 很 容易 地 达到 ， 该 指示 器 通过 候选 度假 选项 的 比较 来 简 述 演化 的 用 户 建议 。 
在 设计 自 适应 的 界面 时 需要 额外 考虑 的 是 承担 用 户 对 在 会 话 中 变化 太 快 的 困惑 的 风险 。 
. QwikShop, EasyShop, CritiqueShop 对 他 们 的 交互 界面 [69] 中 动态 和 静态 的 元 素 进行 了 
划分 。 这 也 是 CATS 推荐 系统 中 的 一 个 关键 性 的 设计 考虑 ， 在 这 里 很 有 必要 让 用 户 保持 对 
其 他 用 户 的 偏好 和 动向 的 关心 ， 并 不 会 产生 困惑 。 这 个 是 通过 使 用 直观 且 确 切 、 共 享 且 独 
立 的 空间 和 精心 设计 的 可 视 化 指示 来 进行 管理 的 。 另 外 ， 介 绍 了 一 些 动态 界面 的 组 件 来 进 
行 群 组 偏好 进展 的 信息 交流 和 监控 达成 群 组 一 致 的 进度 。 


13.4.5 关于 多 文化 的 适用 性 的 差异 


; 研究 表明 ， 一 种 适合 某 类 文化 的 用 户 界面 ， 在 另 一 类 文化 中 却 并 不 适用 [21，23， 

45]。 在 最 近 的 相关 工作 中 ，Chen 和 Pu 展示 了 基于 网 页 评价 界面 [13] 的 一 个 全 面 交叉 文 
化 评估 方式 。 特 别 的 是 ， 他 们 比较 了 用 户 对 电子 商务 推荐 系统 的 两 种 展示 策略 的 反应 : 
1) 作 为 一 个 排序 的 物品 列表 ， 每 个 物品 都 有 一 个 它 被 检索 出 来 的 解释 ; 2) 作 为 一 个 基于 偏 
好 的 组 织 ， 为 了 许多 群 组 的 推荐 系统 共同 的 差异 /权衡 与 排 在 前 面 的 产品 相关 ， 对 这 些 推 
荐 系统 进行 了 分 类 和 概述 。 非 常 简要 的 是 ，120 个 参与 者 (60 位 西方 人 ，60 位 东方 人 ) 的 
主观 评估 显示 了 在 他 们 的 理解 推荐 质量 和 他 们 的 总 体 满意 度 上 ， 有 组 织 的 观点 影响 了 大 多 
数 人 。 想 了 解 关于 主观 观点 的 更 加 全 面 细 致 的 比较 请 参见 文献 [13]。 


13.5 评价 的 评估 : 资源 、 方 法 和 标准 


在 本 节 ， 我 们 最 开始 指出 了 一 些 资源 ， 这 些 资源 通常 在 这 个 领域 中 被 用 来 作为 评估 的 
目标 ， 并 且 提 供 了 一 些 它们 可 见 的 细节 。 接 着 ， 简 述 典型 的 评估 方法 ， 并 列 出 了 一 些 经 常 
被 使 用 的 关键 评估 标准 。 


13.5.1 资源 和 方法 


那些 刚刚 在 这 个 领域 中 起 步 的 人 需要 知道 ， 在 学 术 出 版 物 中 有 很 大 数量 被 用 来 作为 评 
估 目 标的 数据 集 可 以 免费 下 载 s 。 比 如 ，Travel( 在 [26，58，34] 使 用 ) 、PC( 在 [58; 39, 
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40，34] 使 用 ) 、Whiskey( 在 [34] 中 使 用 ) ， 还 有 Digital Camera( 在 [27] 中 使 用 ) 等 这 些 数 
据 集 。Entrée 数据 也 可 以 免费 获取 。 在 其 他 的 工作 中 ， 还 使 用 了 公寓 [55，73] 和 滑雪 度 
假 L29j] 数 据 集 ， 但 是 这 些 不 是 公开 的 。 

总 体 来 说 ， 这 里 采用 了 推荐 系统 所 通用 的 大 多 数 的 评估 方法 ( 见 第 8 章 和 第 15 章 )。 
在 理想 的 情况 下 ， 当 评估 基于 评价 的 推荐 系统 的 性 能 (主观 和 客观 ) 时 ， 实 时 的 适用 性 研究 
和 性 能 评估 必须 最 终 由 真实 的 用 户 来 进行 。 但 是 ， 招 募 到 足够 数量 参与 多 次 测试 的 志愿 者 
却 是 比较 困难 的 。 这 里 的 一 个 解决 方案 ， 通 常会 在 一 些 不 同 的 数据 集 ( 上 面 提 到 的 ) 和 人 工 
生成 的 用 户 属性 来 进行 模拟 的 研究 (在 随后 的 真实 用 户 的 情况 下 ， 产 生 的 结果 期 待 被 验 
证 ) 。 如 果 设 计 得 足够 好 ， 这 些 离线 的 模拟 可 以 确信 用 来 显示 真实 环境 中 的 性 能 。 在 基于 
评价 研究 的 文献 中 通常 被 广泛 采用 的 一 个 进行 性 能 评估 的 方法 ， 是 留 一 验证 方法 [33]。 该 
方法 非常 简洁 ， 通 过 使 用 这 个 方法 ， 数 据 集 中 的 产品 被 设置 为 推荐 目标 ， 并 且 被 暂时 从 数 
据 集 中 移 除 。 它 的 特征 的 一 个 子 集 被 选择 作为 初始 的 查询 条 件 。 在 每 个 推荐 的 环节 中 ， 如 
果 评 价 被 选择 ， 那 么 它们 就 与 推荐 目标 的 特征 一 致 。 在 推荐 出 与 理想 的 产品 最 相似 的 产品 
之 后 ， 模 拟 的 推荐 会 话 就 结束 了 。 重 要 的 是 ， 实 验 性 的 装置 往往 会 有 一 个 相关 的 控制 装置 
〈 比 如， 使 用 一 个 替换 的 检索 策略 或 者 反馈 方法 ) ， 用 来 允许 对 结果 的 重要 性 进行 合适 的 评 
估 。 遗 憾 的 是 ， 唯 一 可 以 接受 的 可 用 性 评估 的 方法 ， 却 是 通过 真实 用 户 的 交互 实验 。 


13.5.2 评估 标准 


在 评价 研究 的 评估 中 使 用 的 共同 客观 性 能 衡量 办 法 包括 : 
效率 : 明确 地 用 用 户 在 找到 他 们 的 目标 产品 前 L39，40,，73，38，72，13，61，58， 
60，2，27]， 所 参与 的 会 话 长 度 的 减少 来 表示 (比如 ， 评 价 环节 /交互 的 次 数 的 减少 )， 找 
到 一 个 推荐 目标 项 所 花 的 时 间 [10，13，2，68]。 
。 EME: 有 很 多 种 途径 来 对 正确 性 进行 衡量 。 包 括 : 
。 评价 预测 准确 度 : 指 展示 出 来 的 评价 匹配 的 次 数 ， 即 被 真实 的 用 户 选 择 的 次 数 L12， 
60, 6]. 
。 评价 应 用 频率 : 指 用 户 选择 的 评价 的 时 间 的 比例 (比如 ， 用 户 偏 好 模型 的 相关 性 ) 
[73, 72, 60 11, 87], ; 
。 推荐 准确 度 : 由 Chen 和 Pu 在 [12] 中 作为 所 选择 的 评价 的 推荐 周期 的 百分比 进行 
衡量 ， 在 这 个 推荐 周期 中 展示 了 推荐 目标 ( 即 推荐 目标 在 被 推荐 的 产品 中 )， 并 且 
在 L61，40，37，68j] 中 作为 成 功 会 话 的 百分比 。 
。 决策 准确 度 : 指 时 间 的 比例 ， 这 些 时 间 中 最 终 被 用 户 接受 的 推荐 是 最 好 的 解决 方 
案 。 在 [9，11] 中 作为 衡量 用 户 在 看 到 所 有 可 替换 推荐 项 时 改变 他 们 想法 的 百 分 
比 。 在 [44] 中 作为 衡量 位 置 替 换 的 度 。 
。 交互 代价 : 往往 指 平均 会 话 点 击 距 离 ， 或 者 达到 指定 目标 所 需 的 交互 (如 评价 ) 次 数 。 
假设 在 各 推荐 周期 中 被 选择 的 一 个 评价 ， 等 同 于 衡量 会 话 长 度 [12，10,，13, 11]. 


评价 研究 中 的 真实 用 户 的 适用 性 性 能 评估 ， 通 常 调查 了 参与 者 和 探寻 他 们 在 如 下 Likert 度 
量 表 (Likert) 主 观 反馈 [9，10，62,，61, 13, 60, 26, 11, 2]. 

系统 设计 

系统 透明 性 : 用 户 是 否 了 解 为 什么 做 推荐 系统 ? 
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用 户 控制 : 用 户 是 否 能 感觉 到 在 交互 中 ， 他 们 能 控制 自己 的 偏好 设置 ? 
能 力 

意识 到 易 用 性 : 用 户 能 否 发 现 系统 很 容易 使 用 ? 

意识 到 有 用 : 用 户 能 否 感觉 到 系统 是 很 有 用 的 (如 相关 的 推荐 、 好 的 解释 等 )? 
决策 置信 度 用 户 觉 得 “最 好 ”的 产品 有 多 么 可 信 ? 

意识 到 努力 : 用 户 多 容易 就 能 获得 他 们 正在 找 的 信息 ? 

意识 到 准确 度 : 建议 的 准确 度 的 程度 ? 

可 信和 度 

满意 度 : 用 户 对 交互 的 满意 度 是 多 少 ? 

推荐 的 可 信和 度 : 用 户 能 否 感觉 到 推荐 系统 一 致 地 提供 与 他 们 的 偏好 相 适 应 的 建议 ? 
用 户 意图 

购买 意图 : 用 户 是 否 愿意 在 某 些 情况 下 购买 推荐 的 产品 ? 

返回 意图 : 用 户 是 否 会 (一 次 次 地 ) 返 回来 重复 使 用 系统 ? 

13.6 总 结 与 展望 


在 本 章 中 ， 我 们 展示 了 过 去 10 年 中 ,评价 研究 进展 的 一 个 非 技 术 性 的 概述 。 我 们 认 
为 这 可 以 为 刚 进入 这 个 领域 中 的 研究 者 提供 一 个 有 用 的 参考 。 我 们 描述 了 在 现存 的 评价 系 
统 中 应 用 这 种 方式 的 好 处 。 学 术 界 所 关注 的 关键 性 问题 和 挑战 ， 表 现 为 能 在 如 下 方面 取得 
多 少 进展 : 1) 鉴 于 优化 偏好 获取 的 自动 的 评价 展示 ; 2) 改 进 的 基于 评价 的 推荐 系统 的 检索 
性 能 。 另 外 ， 我 们 概述 了 一 些 设计 考虑 ， 它 们 影响 了 跨 平 台 和 用 户 环境 反馈 的 评价 模式 。 
最 后 ， 我 们 简 述 了 一 些 侧重 于 评估 基于 评价 的 推荐 系统 的 热门 评估 标准 。 

尽管 在 评价 的 领域 中 有 相当 多 的 研究 活动 ， 但 仍然 存 有 很 多 挑战 和 机 遇 。 这 里 所 能 提 到 的 
远 远 不 够 ,但 是 为 了 对 这 章 进行 总 结 ， 我 们 对 一 些 例子 进行 了 强调 。 首 先 ， 大 部 分 现存 的 系统 
都 假设 了 用 户 会 进行 正 向 评价 ， 用 以 表示 偏好 某 推荐 的 物品 (比如 ， 为 我 展示 像 物品 A， 但 是 更 
便宜 的 物品 )。 有 些 时 候 ， 用 户 选 用 一 个 反 向 的 评价 是 有 意义 的 ， 就 如 “不 要 再 为 我 展示 像 X, 
并 且 位 于 Y 的 物品 *， 这 些 是 有 争议 的 ， 正 如 了 解 用 户 的 需求 和 偏好 对 系统 来 说 很 重要 一 样 。 

在 入 门 决策 话题 上 的 相关 工作 没有 太 多 ， 这 些 工作 集中 于 将 什么 推荐 物品 放 在 第 一 
[15，41]。 最 近 ，Hadzic 和 O’ Sullivan 的 工作 中 ， 介 绍 了 评价 图 的 概念 ， 此 概念 作为 一 
个 关于 用 给 定 推荐 的 评价 可 以 到 达 的 产品 集 的 正式 推理 基础 。 他 们 提出 了 一 个 有 用 的 基础 
计算 最 佳 入 门 推荐 ， 即 使 用 最 小 目录 封面 的 概念 (比如 ， 分辨 推荐 候选 集 ， 如 果 评 价 是 最 
优 的 ， 那 么 从 这 个 集合 中 可 以 到 达 其 他 的 推荐 )。 重 要 的 是 需要 注意 不 是 从 给 定 的 推荐 候 
选项 可 以 到 达 所 有 的 推荐 。 在 相似 的 分 支 中 ， 作 者 描述 了 如 何 确定 存在 没有 被 其 他 产品 所 
覆盖 的 推荐 (例如 ， 通 过 应 用 任何 的 评价 都 不 能 够 到 达 ) 。 在 这 种 情况 下 ， 一 个 有 用 的 原则 
可 能 会 优先 考虑 加 入 这 些 条 目 。 这 个 想法 还 没有 被 现 有 的 研究 所 实现 ， 或 者 更 深层 地 挖掘 
出 来 ， 尽 管 它 给 出 了 非常 美好 的 前 景 。 

从 评价 的 反馈 中 收集 用 户 偏 好 的 建 模 挑战 ， 仍 然 是 当前 研究 所 持续 发 掘 的 一 个 主题 ， 
其 他 用 户 偏 好 建 模 的 方式 和 现 有 方式 的 比较 评估 也 非常 有 趣 。 并 且 ， 近 期 的 工作 中 也 在 关 
注 维 护 分 开 的 长 期 和 短期 的 偏好 模型 [44] 的 想法 ， 但 是 没有 工作 是 注重 于 信息 是 如 何在 它 
们 之 间 被 转换 和 维护 的 ， 并 且 如 此 的 做 法 可 能 会 有 什么 好 处 或 结果 。 对 多 用 户 偏 好 聚合 的 
更 进一步 的 方式 的 调查 是 另外 一 个 开放 的 挑战 ， 迄 今 为 止 在 这 个 领域 中 只 开展 了 很 少 的 研 
究 工 作 。 早 期 在 基于 评价 的 群 组 推荐 系统 [29] 的 研究 工作 中 ， 展 示 了 一 个 协同 环境 中 这 种 


£133 基于 评价 推荐 系统 的 进展 301 


方式 的 好 处 ， 假 定 是 同步 的 反馈 ， 并 且 还 存在 其 他 的 机 会 。 例 子 包 括 ， 其 他 对 异步 的 评价 
的 扩展 ， 且 /或 非 协同 的 环境 (在 这 里 ， 可 能 多 个 用 户 没有 用 协作 的 方式 来 进行 交互 )。 这 
种 研究 可 能 导致 在 应 用 领域 中 采纳 评价 的 方式 作为 交互 的 模式 ， 这 种 评价 的 方式 还 未 被 当 
前 的 评价 研究 所 发 气 ， 例 如 ， 做 游戏 的 方式 。 
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构建 更 值得 信任 和 具有 说 服 力 的 推荐 系统 ， 
特性 对 评估 推荐 系统 的 影响 





Kyung-HyanYoo 和 Ulrike Gretzel 


摘要 用户 是 否 乐于 接受 推荐 系统 提供 的 推荐 信息 对 于 系统 设计 师 和 使 用 它们 的 营销 
人 员 非 常 重要 。 如 果 将 寻求 和 给 予 建议 界定 为 一 种 基本 的 社交 行为 ， 那 么 就 找到 了 理解 推 
荐 系统 说 服 力 的 重要 途径 。 特 别 是 研究 关于 特性 (source characteristic) 的 影响 ， 这 些 特 征 
在 实际 人 际 关系 的 说 服 过 程 中 非常 丰富 ， 因 此 可 以 为 识别 潜在 影响 因素 提供 重要 的 框架 。 
本 章 回顾 目前 人 际 交互 、 人 机 交互 和 人 与 推荐 系统 交互 场景 中 提 到 关于 特性 的 文献 ， 得 出 
的 结论 是 ， 就 推荐 系统 而 言 ， 在 其 他 环境 中 被 确定 为 有 影响 力 的 许多 社会 线索 ， 在 推荐 系 
统 研究 中 尚未 被 引入 和 测试 ， 另 对 推荐 系统 的 研究 和 设计 进行 了 讨论 。 


14.1 简介 


推荐 系统 能 为 在 线 用 户 提 供 个 性 化 的 建议 ， 在 用 户 复杂 的 决策 过 程 中 [7] 起 到 重要 作 
用 。 然 而 ， 尽 管 推荐 系统 能 提供 基于 复杂 数据 挖掘 和 分 析 技 术 的 推荐 ， 但 那 不 意 味 着 由 系 
统 提供 的 建议 就 一 定 会 被 用 户 采 用 。 一 个 建议 是 否 被 视 为 可 靠 的 建议 并 在 实际 决策 中 加 以 
考虑 ， 不 仅 取决 于 用 户 对 推荐 系统 的 感知 ， 而 且 依赖 系统 作为 建议 给 予 者 的 说 服 力 。 传 统 
的 关于 说 服 力 的 文献 表明 用 户 更 倾向 于 接受 来 自 可 靠 信 源 的 推荐 [99]。 因 此 ， 近 年 来 ， 人 
们 认为 考虑 推荐 系统 的 可 信和 度 对 提高 推荐 结果 被 接受 的 可 能 性 [139，36，28，56，94] 非 
党 重要。 问题 是 如 何 加 强 推荐 系统 的 可 信和 度 

近期 关于 技术 的 说 服 力 研究 表明 ， 利 用 用 户 真 实 交往 情境 中 的 社会 因素 的 技术 ， 会 更 
可 靠 和 更 具有 说 服 力 [88，36]。 这 种 概念 强调 了 推荐 系统 作为 准 社会 角色 ， 以 及 有 说 服 力 
的 建议 来 源 ， 这 些 建 议 的 特征 会 影响 用 户 的 感知 。 传 统 的 人 际 说 服 研究 已 经 考察 了 多 种 影 
响 力 特性 的 作用 。 最 重要 的 是 ， 近 来 对 人 机 交互 环境 下 的 研究 发 现 ， 传 统 人 际 说 服 中 起 作 
用 的 这 些 特性 在 人 -技术 交互 时 也 是 相当 重要 的 [36，37，91，108]。 就 推荐 系统 而 言 ， 当 
用 户 对 系统 和 推荐 进行 评价 时 L106，76，94，24，105]j， 一 些 现 有 的 文献 已 研究 了 各 种 系 
统 特性 的 影响 。 虽 然 这 些 发 现 提供 了 关于 特性 的 好 例子 ， 这 些 特性 有 助 于 开发 更 加 可 信和 的 
推荐 系统 ， 但 是 目前 仍 有 许多 可 能 具有 影响 力 的 特性 尚未 得 到 检验 。 

因此 ， 本 章 试图 提供 一 个 可 信和 度 相关 研究 的 大 纲 来 引起 用 户 对 特性 的 注意 ， 这 些 特性 
可 能 在 推荐 系统 可 信和 度 评估 中 起 到 一 定 的 作用 。 为 此 ， 本 章 首先 概述 传统 人 际 关 系 中 发 现 
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的 对 寻求 建议 过 程 有 影响 的 特性 。 随 后 讨论 在 人 机 交互 情境 中 ， 特 别 是 推荐 系统 领域 研究 
过 的 特性 。 最 后 ， 本 章 根据 还 有 待 于 在 推荐 系统 的 环境 下 检验 的 特性 ， 确 认 特性 研究 还 存 
在 哪些 缺口 。 总 体 而 言 ， 通 过 探究 现 有 的 发 现 以 及 识别 重要 的 特性 知识 缺口 ， 在 未 来 研究 
需要 关注 的 方面 ， 本 章 将 为 推荐 系统 研究 提供 相关 的 见解 。 它 也 旨 在 为 试图 增强 推荐 系统 
可 信 度 的 设计 师 提 供 了 实践 意义 。 注 意 ， 本 章 关 注 的 是 推荐 系统 的 整体 认 知 层面 。 用 于 给 
出 推荐 的 评分 的 信任 问题 会 在 第 20 章 解 答 。 


14.2 推荐 系统 作为 社交 角色 


大 部 分 现 有 推荐 系统 研究 将 推荐 系统 视 为 一 种 软件 工具 ， 而 很 大 程度 上 忽视 了 它们 与 
用 户 交互 的 这 一 社交 角色 。 然 而 ， 近 期 研究 更 多 地 认为 应 该 要 把 计算 机 应 用 (如 推荐 系统 ) 
看 作 一 种 社交 参与 者 [108]。Nass 和 Moon[91] 鼓 励 人 们 使 用 包括 计算 机 在 内 的 机 器 构建 
社交 关系 并 在 与 技术 的 交互 中 应 用 社交 规则 。 实 际 上 以 往 许多 的 实证 研究 表明 个 人 通过 技 
术 形 成 社交 关系 ， 且 这 些 社交 关系 葛 定 了 人 机 交互 的 基础 [38，81，89，92，100，107]。 

最 近 推 荐 系统 研究 也 支持 “计算 机 是 社交 参与 者 ”这 一 范式 。 例 如 ，Wang 和 Benbasat[134] 
发 现 用 户 不 仅 能 够 认识 到 推荐 系统 具有 人 类 特征 继而 将 它们 视 为 社交 参与 者 ， 而 且 这 种 社 
交 认 知 会 影响 人 们 对 系统 的 评估 。 实 验 显示 ， 用 户 在 与 在 线 推荐 系统 的 交互 中 感受 到 了 一 
些 人 的 特征 ， 如 善良 、 诚 信 等 。 善 良和 诚信 是 信任 度 的 两 个 重要 维度 ， 而 用 户 对 系统 的 信 
任 度 极 大 地 影响 着 用 户 对 其 可 用 性 的 感知 ， 同 时 也 影响 用 户 采 纳 该 推荐 系统 所 推荐 信息 的 
意愿 。Al-Natour、Benbasat 和 Cenfetelli 的 研究 [3] 认 为 ， 用 户 将 网 上 购物 助手 也 视 为 一 
个 社交 角色 ， 并 且 为 它 赋 予 个 性 和 行为 特征 。 同 样 ，Bonhard 和 Sasse[12] 认 为 对 推荐 系 
统 的 社交 背景 的 理解 ， 是 提供 更 加 有 用 的 、 可 信赖 的 以 及 可 理解 的 推荐 的 关键 。 另 外 ， 
Aksoy 等 的 研究 结果 [2] 发 现 ， 这 一 规则 也 适用 于 人 与 推荐 系统 之 间 的 交互 。 该 研究 表明 ， 
当 推荐 系统 以 类 似 于 用 户 决 策 过 程 的 方式 生成 推荐 时 ， 用 户 会 更 愿意 使 用 推荐 系统 。 这 些 
研究 都 支持 了 在 推荐 系统 研究 中 需要 关注 社交 因素 。 需 要 把 推荐 系统 理解 成 传播 源 ， 在 建 
立 理 论 时 运用 到 人 际 交 流 的 理念 。 一 套 这 样 的 理论 是 关于 特性 在 说 服 的 可 能 性 和 效果 方面 
的 影响 。 这 些 理论 的 基本 假设 是 : 可 信 的 来 源 更 具 说 服 力 。 


14. 3， 来 源 可 信和 度 


信任 度 (credibility) 不 是 一 个 来 源 的 固有 特性 ; 相反， 相关 传播 者 的 可 信 度 的 决策 取 
决 于 消息 接受 者 是 如 何 感 知 该 来 源 的 [99，77，117]。 因 此 ， 信 息 来 源 的 信任 度 可 以 定义 
为 消息 接受 者 对 沟通 信任 度 的 评价 [37]。McGuire 对 信息 来 源 可 信和 度 的 研究 综述 [75] 指 
出 ， 一 个 可 信 的 信息 源 更 容易 被 接受 ， 更 有 说 服 力 。 过 去 大 量 的 研究 证 实 ， 信 息 来 源 可 信 
度 与 对 消息 接收 者 态度 、 行为 目的 以 及 行为 的 影响 呈正 相关 [42，46，64，118，119] 。 

信任 度 包含 了 多 个 维度 [13，39，102，117]。 虽 然 文献 提出 了 很 多 种 维度 ， 但 被 广泛 
承认 的 关键 元 素 有 两 个 ; 可 信和 度 (trustworthiness) 和 专业 性 (expertise) [99, 37, 36, 
109]。 可 信和 度 和 专业 性 已 被 广泛 研究 并 在 推荐 系统 的 情境 中 考察 [140]。 


14.3.1 ALE 


一 个 来 源 可 信 度 指 的 是 性 格 或 个 人 诚实 度 等 方面 [99]。 意 图 对 确认 来 源 信任 度 也 起 到 一 
定 的 作用 。 那 些 具有 说 服 意图 的 信息 来 源 被 认为 比 那些 没有 说 服 意图 的 更 不 值得 信赖 [102]。 
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因此 ， 可 信和 度 通常 都 是 通过 某 些 词 来 描述 的 ， 如 具有 良好 动机 的 、 可 信赖 的 、 公 正 的 
[37]. Mayer, Davis 和 Schoorman[70] 将 善意 (benevolence) 和 完整 性 (integrity) 概念 化 为 
可 信 度 的 维度 。Delgado-Ballester[26] 认 为 可 依赖 性 和 目的 性 是 重要 的 可 信和 度 维度 。Fogg 
[36] 明 确 了 影响 可 信和 度 感知 的 关键 点 : 1) 信 息 来 源 是 公平 和 公正 的 ; 2) 信 息 来 源 可 能 会 与 
它们 自己 的 利益 不 一 致 ，3) 信 息 来 源 感知 相似 性 。 在 推荐 系统 环境 中 ，Xiao 和 Benbasat 
[138j 建 议 测试 推荐 系统 的 善意 和 诚信 等 特性 ， 善 意 是 指 推荐 系统 关心 用 户 和 体现 用 户 的 
兴趣 的 程度 ， 诚 信 是 指 推荐 系统 坚持 用 户 可 接受 的 一 套 原 则 (如 诚实 ) 。 


14. 3.2 专业 能 力 


Mayer 等 [70] 将 专业 能 力 描述 为 衡量 信息 源 在 某 些 领域 产生 影响 的 能 力 。Fogg 
等 [37] 将 它 概念 化 ， 如 知识 丰富 的 、 有 经 验 的 、 能 干 的 ， 因此， 这 一 维度 强调 的 是 信息 源 
的 知识 和 技能 。 同 样 ，O’Keefe[99] 认 为 专业 能 力 指 的 是 胜任 能 力 、 专 业 性 或 资格 。Fogg[36] 
提供 了 很 多 示例 ， 指 出 专业 知识 的 感知 能 力 可 以 像 宣 告 一 个 人 是 专家 的 一 种 标签 ， 一 种 外 
在 证 据 ， 或 者 是 成 就 记录 。Xiao 和 Benbasat[138] 将 推荐 系统 的 能 力 描述 为 系统 有 效 运 行 
的 能 力 、 技 能 和 专业 知识 。 


14.3.3 ”对 来 源 可 信和 度 的 影响 


一 个 信息 来 源 是 否 被 认为 拥有 专业 知识 和 值得 信任 很 大 程度 上 依赖 于 它 的 特征 。 因 
此 ， 信 息 特 性 对 于 用 户 的 判断 是 很 重要 的 线索 。 人 们 通常 不 会 感知 到 这 些 线索 在 起 作用 ， 
因为 人 对 外 界 的 认 知 处 理 通常 通 过 神经 末梢 而 不 是 神经 中 枢 ， 在 此 不 作 论述 L103] 。 


14.4 人 际 交互 中 信息 特性 的 研究 


Hovland 和 他 的 同事 [55] 认 为 决定 说 服 是 否 成 功 的 主要 刺激 类 型 之 一 可 以 被 概括 为 感知 
信息 源 的 可 察觉 (observable) 性 。 他 们 将 来 源 可 信 度 感知 认定 为 对 特定 源 线索 观察 的 直接 结 
果 。 许 多 研究 人 员 已 经 调查 了 人 际 互 动 中 影响 判读 信息 来 源 可 信 度 的 各 种 传播 者 特征 。 


14. 4. 1 相似 度 


毫 无 疑问 ， 在 信息 来 源 和 用 户 之 间 感 知 到 的 相同 点 和 差异 点 能 够 影响 用 户 对 信息 来 源 
可 信 度 的 判断 [99]。 总 之 ， 同 质 性 理论 [65] 指 出 人 们 喜欢 与 自己 相似 的 人 。 然 而 ， 相 似 性 
和 信任 维度 之 间 的 关系 似乎 比较 复杂 。 
14.4.1.1 专业 性 判断 

过 去 的 实证 研究 对 相似 性 和 来 源 专业 性 判断 之 间 的 关系 并 没有 得 到 一 致 的 结论 。 例 
如 ，Mills 和 Kimble[78] 发 现 相似 的 人 比 相 异 的 人 更 具有 专业 性 。 然 而 ，DeliaL27] 察 觉 到 
信息 来 源 和 信息 接收 者 之 间 的 相似 会 使 得 信息 接收 者 更 少 地 把 信息 源 当 作 专 家 。 相 反 ， 一 
些 研究 发 现 相似 度 在 判断 信息 源 的 专业 性 上 不 起 任何 作用 [126，6j]。 
14.4.1.2 信任 度 判 断 

对 信息 来 源 感知 的 相似 度 不 同 ， 也 会 对 传播 者 的 感知 信任 度 起 到 不 同 的 作用 。 
OKeefe[99] 提 出 ， 感 知 到 的 态度 相似 可 以 影响 接收 者 对 来 源 的 喜爱 ， 越 高 的 信息 来 源 的 
喜爱 通常 伴随 着 越 高 的 传播 者 信任 度 判 断 。 然 而 ，Atkinson[6] 发 现 种 族 相似 和 差异 对 信 
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息 来 源 的 感知 可 信 度 没有 影响 ， 而 且 Delia[27] 观 察 到 相似 度 有 时 会 前 弱 对 信任 的 感知 。 

通过 呈现 相似 度 和 判别 交流 者 信任 度 之 间 关 系 的 复杂 本 质 ，O'Keefe[99] 指 出 感知 的 
相似 度 对 传播 者 可 信 度 的 判断 取决 于 接收 者 感知 到 它 是 否 以 及 如 何 与 手头 上 问题 存在 相关 
性 。 因 此 ， 不 同类 型 的 相似 性 在 不 同 的 交流 环境 中 可 能 产生 不 同 的 影响 。 


14.4.2 BRE 


人 们 下 意识 地 倾向 于 赞同 那些 看 起 来 可 爱 的 人 [15]。 喜 好 度 指 的 是 一 个 人 可 能 会 对 男 一 
个 人 产生 的 情感 联结 [122]。 现 有 研究 基本 上 支持 这 种 假设 ， 即 让 人 喜爱 的 传播 者 比 起 那些 
让 人 讨厌 的 传播 者 对 行为 者 有 更 大 的 影响 [30，40，111]。 喜 好 度 被 认定 是 一 种 说 服 策略 和 
一 种 自我 表现 的 方案 [21]。O'Keefe[99] 认 为 ， 对 信息 来 源 更 高 的 喜爱 度 通常 伴随 着 更 高 的 对 
传播 者 可 信 度 的 判断 。 进 一 步 ， 许 多 研究 发 现 相似 性 增加 了 喜好 度 L[18，19，52] 。 

同时 也 有 证 据 表 明 ， 接 收 者 对 传播 者 的 喜爱 程度 能 够 影响 传播 者 信任 度 的 判断 ， 而 不 
会 影响 对 传播 者 专业 性 的 判断 [99，66] 。 


14.4.3 ”权威 的 象征 


说 服 力 相 关 的 研究 文献 有 证 据 表 明 ， 我 们 经 常会 依赖 人 脑 认 知 捷径 ， 觉 得 应 该 听从 那 
些 有 权威 象征 (如 某 种 头衔 或 语调 ) 的 人 [109，11，51，41，104]。Hofling 等 L51] 发 现 像 
"Dr. ”头衔 等 简单 的 东西 可 以 让 被 试 者 认为 来 源 是 可 信 的 ， 这 种 获取 顺从 的 手段 惊人 地 有 
效 。 同 样 ， 研 究 还 表明 ， 传 播 者 的 教育 程度 、 职 业 、 接 受过 的 训练 和 经 验 等 线索 会 影响 信 
息 接收 者 对 来 源 可 信和 度 的 感知 。 例 如 ，Hewgill 和 Miller[50] 研 究 了 不 同 职业 (教授 和 高 中 
二 年 级 学 生 ) 的 传播 者 ， 同 样 信息 对 感知 可 信和 度 的 影响 ， 发 现 那些 被 告知 消息 来 自 于 教授 
的 人 认为 消息 来 源 以 及 消息 本 身 都 更 加 可 信 。 

制服 和 剪裁 考究 的 西装 是 另 一 个 公认 的 ， 可 以 影响 可 信 度 的 判断 并 导致 盲目 顺从 的 权 
威 象征 符 L109，21]。Bickman[11] 发 现 ， 穿 安全 警卫 制服 的 人 比 穿 普通 衣服 的 人 更 易 驱 使 
陌生 人 做 事情 。Sebastian 和 Bristow[116] 揭 示 了 穿着 很 正式 的 人 比 那些 衣着 休闲 的 人 更 
易 取 得 信任 。 


14.4.4 演讲 的 风格 


现 有 的 很 多 研究 表明 演讲 的 风格 也 会 影响 对 演讲 者 的 可 信 度 判断 。 例 如 ， 许 多 研究 已 
证 实 ， 当 研究 者 为 他 们 的 论点 提供 正 反 两 方面 的 论据 ， 而 不 仅仅 只 陈述 他 们 支持 那 一 面 
时 ， 更 能 够 增强 他 们 的 可 信和 度 [31，121]。Cooper、Bennett 和 Sukel[23] 认 为 当 演讲 者 以 
复杂 、 难 以 理解 的 方式 表达 时 ， 人 们 对 他 们 的 专业 性 评价 会 更 高 。 这 也 上 暗示 了 当 专 家 所 表 
达 的 内 容 无 法 被 外 行 理解 时 ， 他 们 所 具有 的 说 服 力 最 大 [109]。 也 有 调查 发 现 ， 演 讲 得 越 
不 流利 ， 演 讲 者 的 专业 能 力 会 被 划分 到 较 低 的 等 级 [73，14，32，115]， 并 且 演 讲 的 语 速 
也 会 影响 可 信和 度 判断 ， 尽 管 这 些 影 响 并 不 如 其 他 影响 力 证 据 显 著 [98，1，45，68，63]。 
同时 ， 标 示 出 论据 的 来 源 也 会 增强 对 表达 者 的 专业 程度 和 可 信和 度 的 感知 [35，72] 。 


14.4.5 外 在 吸引 力 


许多 研究 发 现 ， 具 有 外 在 吸引 力 的 沟通 者 更 具 说 服 力 [54，123]。Eagly 等 [29] 指 出 ， 
人 们 对 于 好 看 的 外 表 会 有 积极 的 反应 ， 好 的 外 在 可 以 归纳 为 讨 人 喜欢 的 特征 ， 如 天 赋 、 善 
良 诚 实 和 智慧 等 。 外 在 吸引 力 产 生 的 是 间接 的 影响 ， 尤 其 是 通过 影响 接收 者 对 传播 者 喜 
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爱 程度 [99] 。 
14.4.6 幽默 


过 去 的 研究 发 现 ， 在 消息 接收 者 评估 信 源 可 信和 度 时 ， 幽 默 感 会 产生 一 定 的 影响 。 然 
而 ， 不 同 研究 中 ， 特 定 的 影响 也 不 同 。 许 多 研究 表明 幽默 感 对 于 传播 者 信任 度 判 断 有 积极 
的 影响 ， 但 是 对 专业 性 判断 几乎 不 起 任何 作用 [20，44，129]。 幽 默 的 积极 影响 在 于 增加 
用 户 对 传播 者 的 喜爱 程度 ， 且 这 种 喜爱 程度 有 助 于 增加 信任 度 感知 。 相 反 ， 一 些 研 究 者 却 
发 现 当 过 度 地 或 者 不 合理 地 使 用 幽默 时 ， 幽 默 会 减少 用 户 对 传播 者 的 喜爱 程度 、 信 任 度 的 
感知 以 及 信息 源 专业 性 的 感知 [17，86 130]. 


14.5 人 机 交互 中 的 特性 


显然 ， 计 算 机 是 一 种 工具 或 媒介 ， 而 不 是 社交 生活 中 的 行动 者 。 然 而 ,“ 媒 介 等 同 ? 理 论 表 
明 人 与 计算 机 、 电 视 和 新 媒体 的 交互 从 根本 上 讲 是 社交 化 的 和 自然 的 ， 就 像 是 真实 生活 中 的 互 
动 [108]。 因 此 这 个 理论 表明 技术 应 该 被 理解 为 社交 参与 者 而 不 仅 是 工具 或 媒体 。 基 于 这 种 新 的 
范式 ， 越 来 越 多 的 研究 去 关注 技术 中 某 些 特定 的 社交 属性 是 如 何 影 响 用 户 的 感知 和 行为 的 。 

当 用 户 评 价 计算 机 和 内 容 时 ， 他 们 之 间 的 相似 性 就 非常 重要 [91，36]。 例 如 ，Nass 和 
Moon[91] 认 为 ， 表 现 出 类 人 特性 的 计算 机 更 具有 说 服 力 。 在 他 们 的 研究 中 ， 比 起 一 个 被 动 从 
属 的 计算 机 ， 占 主导 地 位 的 参与 者 更 加 容易 被 一 个 主动 性 更 强 的 计算 机 吸引 以 及 激发 自己 的 
智慧 。 与 占 主导 地 位 的 计算 机 相 比 ， 从 属 参 与 者 对 从 属 计算 机 和 主导 型 计算 机 的 反应 也 相 
似 ， 即 使 它们 本 质 上 具有 相同 的 内 容 。Nass、Isbister 和 Lee 的 研究 [90] 还 揭示 了 人 口 统计 学 
相似 度 的 影响 。 他 们 的 研究 发 现 ， 当 用 户 面 对 与 自己 相近 的 计算 机 智能 体 时 ， 用 户 感知 到 这 
样 的 计算 机 智能 体 更 具有 吸引 力 、 更 值得 信赖 、 更 具 说 服 力 和 更 有 智慧 。 

权威 性 表达 在 人 与 机 器 交互 中 被 认定 为 是 有 影响 力 的 因素 。Nass 和 Moon[ 91 ] KR, 
与 标记 为 普通 级 的 电视 机 相 比 ， 被 标记 为 专家 级 的 电视 被 认为 能 够 提供 更 好 的 内 容 。Fogg 
[36] 也 指出 ， 承 担 权 威 角色 的 计算 技术 会 更 具有 说 服 力 。 他 认为 展示 所 获奖 项 或 第 三 方 认 
可 (如 批准 印章 ) 的 网 站 被 视 为 具有 更 高 的 可 信和 度 。 

许多 研究 [90，93] 表 明 计 算 机 智能 体 的 人 口 统计 学 特征 影响 了 用 户 的 感知 。Nass 
等 [93] 介 绍 ， 一 些 用 户 会 对 计算 机 带 有 性 别 或 种 族 成 见 。 研 究 还 发 现 ， 人 们 认为 配置 男性 
声音 的 辅导 计算 机 比 设 置 女性 声音 的 计算 机 更 有 能 力 ， 也 更 让 人 喜欢 。 他 们 发 现 ， 女 声 发 
音 的 计算 机 在 指导 爱 和 关系 方面 要 比 男声 发 音 的 计算 机 优秀 ， 但 是 计算 能 力 要 比 男 声 发 音 
的 计算 机 差 。 

此 外 ， 语 言 的 使 用 ， 如 奉承 [38]、 道 歉 [132] 和 礼貌 [71] 也 会 影响 用 户 的 感知 和 行为 。 
此 外 ,计算机 智能 体 的 外 在 吸引 力也 是 重要 的 。Nass、Isbister 和 Lee[90] 指 出 ， 用 户 更 
喜欢 与 更 具 吸 引力 的 计算 机 智能 体 进行 交流 和 互动 。 

最 后 ， 在 人 际 交 互 环境 中 也 验证 了 幽默 特征 。Morkes、Kernal 和 Nass[83j] 发 现 那些 
展示 出 幽默 的 计算 机 更 惹 人 喜爱 。 然 而 ， 更 多 存在 于 人 与 人 交互 中 的 基于 幽默 的 认同 感 与 
更 深层 次 的 交互 ， 还 没有 复制 到 人 机 交互 的 情境 中 。 


14.6 用户 与 推荐 系统 交互 的 特性 
如 果 计 算 机 被 视 为 社交 参与 者 ， 那 么 与 推荐 系统 的 交互 也 应 该 被 理解 为 一 种 社交 化 的 
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交互 。 特 别 是 那些 根据 用 户 的 显 式 输入 提供 直接 反馈 的 系统 ， 显 示 出 许多 与 社交 交流 相关 
联 的 特性 。 

在 现 有 的 推荐 系统 文献 中 ， 许 多 过 去 的 研究 已 经 调查 出 推荐 系统 的 特定 属性 是 如 何 影 
响 用 户 的 系统 评估 的 。Xiao 和 Benbasa[138] 将 研究 中 与 推荐 系统 类 型 、 输 入 、 处 理 、 输 
出 有 关联 的 多 种 属性 进行 了 分 类 。 详 见 第 8 章 、 第 15 和 第 16 章 。 

伴随 着 对 推荐 系统 行动 主体 的 兴趣 和 实际 使 用 的 增长 ， 许 多 研究 已 经 调查 了 行动 主体 
特征 的 影响 。 因 此 ， 接 下 来 的 部 分 ， 将 会 回顾 这 些 之 前 确定 为 有 影响 的 特性 。 


14.6.1 推荐 系统 类 型 


推荐 系统 会 有 不 同 的 展现 形式 ， 且 可 以 通过 过 滤 方 法 、 决 策 策 略 或 系统 所 能 支持 的 决 
策 数量 对 其 进行 分 类 [138]。 之 前 许多 研究 已 经 讨论 了 不 同类 型 的 推荐 系统 的 优点 和 缺点 
[5，69，16]。 通 过 比较 不 同 的 过 滤 方 法 ， 发 现 综合 了 协同 过 滤 和 基于 内 容 过 滤 的 混合 型 
推荐 系统 要 比 传统 的 单纯 只 用 协同 过 滤 技术 的 系统 更 有 效 [113，114]j。BurkeL16] 也 证 实 
了 混合 推荐 系统 能 够 对 用 户 偏好 提供 更 精确 的 预测 。 用 于 推荐 系统 中 的 不 同 决策 策略 中 ， 
补充 性 推荐 系统 要 比 非 补充 性 推荐 系统 能 激发 更 多 的 信任 感 ， 使 人 感知 到 它 的 有 用 性 和 功 
能 健全 性 [138] 。 同 时 也 会 增加 用 户 对 其 在 产品 上 做 决策 的 信心 L33]。 推 荐 系统 支持 的 决 
策 的 数量 方面 ，Xiao 和 Benbasat[138] 认 为 基于 需求 的 推荐 系统 相对 于 基于 特征 的 推荐 系 
统 能 帮助 用 户 更 好 地 明确 自己 的 需求 并 精确 回答 偏好 提取 的 问题 ， 从 而 获得 更 好 的 决策 质 
量 ， 因 而 基于 需求 的 系统 更 适合 新 手 用 户 [34] 。 


14.6.2 输入 特性 


推荐 系统 的 输入 特性 包括 许多 相关 因素 ， 如 偏好 提取 方法 、 生 成 新 的 或 额外 推荐 的 便 
捷 性 ， 以 及 当 与 推荐 系统 偏好 提取 界面 交互 时 用 户 的 控制 程度 等 [L138]。 许 多 之 前 的 研究 
发 现 ， 与 推荐 系统 输入 设计 相关 的 特性 会 对 系统 用 户 的 评估 产生 影响 。Xiao 和 Benbasat 
[138] 的 研究 表明 ， 偏 好 提取 方法 ( 隐 式 与 显 式 ) 影 响 了 用 户 对 系统 的 评估 。 隐 性 偏好 提取 
方法 更 能 让 用 户 体 现 到 推荐 系统 的 易 用 性 和 满足 感 ， 相 对 地 ， 显 式 方式 被 用 户 认为 是 更 直 
接 且 能 带 更 佳 的 决策 。 

给 予 用 户 更 多 的 控制 也 是 评价 系统 的 一 个 重要 影响 因素 。West 等 [137] 认 为 给 予 系统 
用 户 更 多 的 控制 将 会 增加 他 们 对 系统 的 信任 感 和 满足 感 。 新 的 研究 [76] 表 明 ， 比 起 那些 系 
统 控 制 以 及 联合 控制 的 推荐 系统 ， 使 用 用 户 控制 界面 的 用 户 对 系统 有 更 高 的 满足 感 。 此 
外 ， 使 用 用 户 控制 界面 的 用 户 感 党 到 ， 推 荐 系统 准确 地 表达 了 他 们 的 品味 ， 对 系统 有 更 高 
的 忠诚 度 。Pereira[101] 发 现 ， 当 用 户 在 与 系统 交互 中 控制 力 增强 时 ， 他 们 将 对 推荐 系统 
表现 出 更 积极 的 反应 。Komiak 等 [62] 的 研究 表明 ， 让 用 户 控制 整个 过 程 是 增强 用 户 对 虚 
拟 行动 者 信任 度 的 首要 因素 。Wang[133] 的 研究 也 支持 了 用 户 控 制 的 重要 性 ， 他 指出 ， 约 
束 较 多 的 推荐 系统 对 用 户 具 有 更 少 的 信任 和 帮助 。 

除了 控制 ， 偏 好 提取 过 程 的 结构 性 特征 (相关 性 、 透 明 性 和 使 用 成 本 ) 也 会 影响 用 户 对 
推荐 系统 的 感知 [43]。Gretzel 和 Fesenmaier 的 研究 发 现 提取 过 程 的 主题 相关 性 、 透 明 性 
和 用 户 输入 的 操作 成 本 显著 地 影响 了 用 户 对 提取 过 程 的 认 知 和 评价 。 这 些 发 现 表明 ， 通 过 
回答 问题 ， 系 统 承担 了 一 种 社交 角色 ， 表 达 了 交流 用 户 兴 趣 偏好 ， 这 都 被 认为 是 有 价值 
的 。 回 答 的 问题 越 多 ， 就 越 能 提供 有 价值 的 反馈 。 同 时 ， 在 交互 过 程 中 显 式 的 引导 也 很 重 
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要 。 虽 然 没 有 专门 测量 过 信任 程度 ， 但 善意 和 直接 意图 是 信任 重要 的 驱动 因素 ， 并 且 也 暗 
含 在 过 程 透 明 性 之 中 。McGinty 和 SmythL74] 表 明 ， 推 荐 系统 的 对 话 风 格 在 输入 过 程 中 也 
是 很 重要 的 。 相 反 L43]， 他 们 认为 基于 对 比 的 推荐 方法 (要 求 用 户 从 一 系列 的 推荐 项 目 中 
选择 他 们 偏爱 的 项 目 ， 而 非 深 度 对 话 方法 直接 询问 用 户 关 于 产品 特色 重要 性 的 问题 ) 能 最 
小 化 用 户 的 操作 成 本 ， 且 同时 保证 推荐 质量 。 


14.6.3 过 程 特性 


推荐 系统 在 计算 推荐 过 程 中 显示 出 的 特性 似乎 影响 着 用 户 对 系统 的 认 知 [138]。 该 过 
程 因素 包含 关于 搜索 过 程 和 系统 响应 时 间 的 信息 。Mohr 和 Bitner[79] 指 出 ， 系 统 用 户 使 
用 各 种 线索 或 指标 来 评估 通过 决策 辅助 手段 节省 的 工作 量 。 告 知 用 户 关于 搜索 过 程 的 指标 
有 助 于 用 户 意 识 到 系统 为 用 户 节 省 的 工作 量 。 用 户 对 通过 决策 辅助 手段 节省 的 工作 量 有 着 
越 多 认 知 ， 那 么 他 们 对 决策 过 程 就 会 越 满意 [9]。Sutcliffe 等 L125] 发 现 了 用 户 对 未 提供 搜 
索 过 程 指示 的 信息 检索 系统 提出 了 可 用 性 或 理解 的 问题 。 

有 研究 考虑 了 系统 响应 时 间 的 影响 ， 即 用 户 输入 和 系统 响应 的 间隔 时 间 是 非常 重要 
的 。Basartan[8] 通 过 改变 一 个 模拟 的 导购 网 站 的 响应 时 间 ， 发 现 用 户 更 不 喜欢 那些 要 等 很 
长 时 间 才 能 获得 推荐 结果 的 网 站 。 相 反 ，Swearingen 和 Sinha[128] 发 现 用 户 用 在 注册 和 接 
收 来 自 系统 推荐 的 时 间 在 系统 用 户 认 知 方面 却 没 有 明显 的 影响 。 较 长 的 注册 过 程 提高 用 户 
对 系统 的 满意 度 和 认可 度 [76]。Xiao 和 Benbasat[138j] 解 释 ， 先 前 关于 系统 响应 时 间 矛 盾 
的 研究 成 果 可 能 取决 于 用 户 的 成 本 收益 评估 。 当 用 户 把 等 待 的 效益 看 成 高 质量 的 推荐 时 ， 
他 们 认为 用 户 不 会 对 推荐 系统 形成 负面 的 评价 。 一 些 关于 提取 成 本 以 及 提取 过 程 中 的 认 知 
价值 之 间 的 关系 研究 结果 [43] 都 支持 该 假设 。 


14. 6.4 输出 特性 


推荐 系统 输出 阶段 描述 的 特性 与 呈 递 给 用 户 的 推荐 内 容 以 及 展示 格式 相关 联 。 现 有 研 
究 结果 表明 推荐 的 内 容 和 格式 对 用 户 评估 推荐 系统 具有 重大 的 影响 [135，138，120，24] 。 
Xiao 和 Benbasat[138] 指 出 ， 当 用 户 对 推荐 系统 进行 评价 时 ， 推 荐 内 容 的 三 大 重要 方面 : 
推荐 选择 的 熟悉 度 、 推 荐 产品 的 信息 数量 以 及 对 于 推荐 结果 的 解释 ， 是 非常 相关 的 。 

研究 发 现 更 熟悉 的 推荐 结果 能 提高 用 户 对 推荐 系统 的 信任 度 。Swearingen 和 Sinha[ 120] 
发 现 为 用 户 推 荐 熟悉 的 商品 有 助 于 建立 用 户 对 推荐 系统 的 信任 。Cooke 等 L22] 的 一 项 研究 
也 表明 推荐 不 熟悉 的 物品 会 降低 用 户 对 推荐 系统 的 评价 。 进 一 步 ， 获 得 产品 的 信息 能 够 对 
用 户 对 推荐 系统 的 评价 产生 积极 的 影响 。Sinha 和 Swearingen[120j] 表 明 ， 推荐 网 页 上 有 详 
细 的 产品 信息 能 加 强 用 户 对 推荐 系统 的 信任 度 。Cooke 等 [22] 也 说 明 ， 如 果 推 荐 系统 提供 
了 新 产品 的 详细 信息 ， 将 会 提高 推荐 给 用 户 的 不 熟悉 产品 的 吸引 力 。 

目前 已 有 大 量 研究 探讨 有 关 推 荐 系统 用 户 评价 解释 的 影响 ，Wang 和 Benbasat[135] 
发 现 对 推荐 系统 合理 逻辑 的 解释 能 够 增强 用 户 对 推荐 系统 能 力 和 行为 的 信心 。Herlocker 
等 [48] 也 认为 解释 推荐 结果 对 于 建立 对 系统 的 信任 非常 重要 ， 因 为 当 用 户 不 明白 为 什么 某 些 
物品 被 推荐 给 他 们 时 ， 他 们 是 不 太 可 能 相信 这 些 推荐 的 。 为 了 提高 用 户 对 系统 的 信任 度 ， 推 
荐 系统 必须 通过 解释 内 容 来 建立 用 户 和 系统 之 间 的 连接 。 同 样 ， 其 他 研究 [105,，131j 也 表明 
在 有 解释 界面 的 情况 下 用 户 表 现 出 更 多 的 信任 感 。 

展示 给 用 户 的 推荐 结果 的 格式 也 会 影响 推荐 系统 的 用 户 评价 。Sinha 和 Swearingen[ 120] 
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表明 推荐 结果 展示 界面 的 导航 和 布局 明显 影响 了 用 户 对 系统 的 满意 度 。Sinha 和 Swearingen 
[128] 进 一 步 研究 发 现 ， 界 面 导航 和 布局 设计 也 影响 了 用 户 对 系统 的 综合 评价 。 无 独 有 偶 ， 
Yoon 和 Lee[142] 也 表明 界面 设计 和 展示 格式 影响 了 系统 用 户 的 行为 。 然 而 ，Bharti 和 
Chaudhury[10] 的 一 项 研究 却 发 现 关 于 用 户 的 满意 度 ， 导 航 效果 不 起 任何 明显 作用 。 

此 外 ，Schafer[112] 建 议 在 一 个 界面 内 ， 合 并 偏好 界面 和 推荐 引导 界面 可 以 使 推荐 系统 看 起 
来 更 有 帮助 ， 因 为 这 种 新 的 “动态 查询 ”界面 能 提供 关于 个 人 偏好 改变 的 影响 的 及 时 反馈 。 因 为 
它 合并 了 输入 和 输出 的 界面 ， 该 建议 涉及 的 提示 (如 透明 度 ) 已 经 在 输入 特性 中 讨论 过 。 


14.6.5 Pa RAY E AE HE HE 


推荐 系统 通常 包含 虚拟 角色 来 指导 用 户 完成 操作 过 程 。 可 以 假设 如 果 推 荐 系统 更 加 人 
性 化 ， 那 么 社交 反应 将 会 更 普遍 。 事 实 上 ， 大 量 的 研究 强调 在 推荐 系统 的 上 下 文中 ， 内 赂 
的 智能 体 起 到 重要 的 作用 。 例 如 ， 已 发 现 系 统 接口 中 人 性 化 虚拟 智能 体 的 存在 既 提高 系统 
可 信和 度 L85]、 增 加 社交 化 [106]、 增 强 网 上 购物 体验 [53]， 又 增强 信任 [136]。 随 着 对 这 种 
接口 智能 体 的 感 兴趣 ， 很 多 研究 已 经 开始 研究 接口 智能 体 的 某 些 特性 如 何 影响 推荐 系统 用 
户 的 认 知 和 评价 。 

,智能 体 的 重要 识别 特性 之 一 是 拟人 化 。 拟 人 化 的 定义 是 拥有 人 类 外 表 和 行为 属性 的 程 
度 [96，97，60，95]。 许 多 研究 者 发 现 内 艇 智能 体 的 拟人 化 可 影响 用 户 与 计算 机 的 交互 
(如 [96，60，95])， 特 别 是 与 推荐 系统 的 交互 [106]。 至 今 ， 拟 人 化 的 智能 体 的 优势 和 开 
销 一 直 备 受 争议 。 例 如 ， 在 一 些 研究 中 发 现 ， 相 比 于 那些 不 太 拟人 化 的 接口 智能 体 ， 更 拟 
人 化 的 接口 智能 体 ， 更 可 人 和信、 更 迷人 、 更 吸引 人 、 更 令 人 喜爱 [97，60]， 然 而 其 他 一 些 研 
究 结 果 却 得 到 相反 的 结果 [96，95，87]。 与 这 种 智能 体 的 社交 行为 可 能 会 让 用 户 增加 对 实 
际 系统 功能 的 期 望 。 

人 的 声音 是 一 个 非常 强大 的 社交 因素 ， 已 经 深入 影响 了 人 类 的 交互 [88]。 然 而 ， 在 嵌 人 
的 接口 智能 体 的 上 下 文中 研究 结果 并 不 普及 并 且 目 前 尚未 定论 。 在 一 些 研 究 中 ， 发 现 接口 智 
能 体 的 声音 输出 特性 有 助 于 诱导 社交 和 引起 用 户 的 情感 表达 [106，82]。 但 是 其 他 研究 却 发 
现 当 系统 智能 体 只 用 文字 沟通 时 的 社交 化 水 平 更 高 L[124]。 同 时 发 现 接口 智能 体 的 人 口 统计 
特征 也 影响 了 系统 用 户 的 感知 和 行为 。Qiu[106] 表 示 ， 当 智能 体 符合 他 们 的 种 族 特性 、 性 别 
等 时 ， 系 统 用 户 评价 系统 更 善于 交际 、 更 有 能 力 和 更 令 人 享受 从 而 支持 同 质 性 假说 。Cowell 
和 Stanny[25] 也 观察 到 系统 用 户 更 喜欢 与 他 们 种 族 匹配 的 并 且 看 上 去 更 有 活力 的 对 象 交互 。 
Nowak 和 RauhL97] 的 研究 表明 人 们 明显 倾向 于 选择 匹配 他 们 性 别 的 特征 的 推荐 。 
除了 以 上 类 似 因素 之 外 ， 在 散人 的 接口 智能 体 的 研究 中 也 调查 了 其 他 特性 。Holzwarth 
等 [53j 已 测试 了 智能 体 吸引 性 和 专业 性 的 作用 。 他 们 发 现 ， 在 产品 加 入 中 等 水 平 智 能 可 以 作 
为 一 个 更 有 效 的 销售 智能 体 ， 而 在 高 水 平 产品 涉 入 中 专家 智能 体 则 是 一 个 更 有 效 的 说 服 者 。 
而 且 ，Cowell fil Stanney[25] 强 调 了 接口 智能 体 中 非 语 言行 为 像 面部 表情 、 眼 神 交会 、 手 势 、 
副 语言 交际 和 姿势 等 的 潜在 影响 。 然 而 ， 目 前 对 这 一 领域 的 研究 还 是 非常 有 限 的 。 


14.7 讨论 


Swearingen $I Sinha[128j 表 示 , “推荐 系统 的 最 终 效 果 将 依赖 于 超出 算法 质量 的 诸多 因 
Ko 然而， 推荐 系统 特性 通常 得 以 实现 是 因为 它们 可 以 被 实施 执行 。 这 些 特性 可 能 会 在 系 
统 总 体 评价 或 可 用 性 研究 中 被 测试 ， 但 是 几乎 很 少 会 根据 其 说 服 力度 进行 评估 ; Haubl 和 
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Murray[47] 证 明 在 实时 推荐 中 ， 推 荐 系统 的 确 对 消费 者 偏好 和 选择 产生 深刻 影响 。 因 此 ， 
将 推荐 系统 界定 为 不 但 是 社交 角色 ， 而 且 是 说 服 性 角色 ， 这 对 理解 他 们 潜在 因素 至 关 重 
要 。 上 述 文献 中 表明 大 量 的 推荐 系统 特性 可 能 都 具有 影响 力 。 遵 循 “ 计 算 机 作为 社交 行动 
者 ”的 模式 [108，36]， 最 近 的 推荐 系统 研究 已 经 开始 强调 推荐 系统 社交 方面 的 作用 ， 并 强 
调整 合 社交 特征 以 创造 更 可 信和 的 和 更 有 说 服 力 的 系统 L134，106，3]。 对 推荐 系统 “作为 社 
交 参 与 者 ”的 这 种 认识 对 推荐 系统 的 研究 和 设计 有 重大 意义 。 最 重要 的 是 ,将 人 与 推荐 系 
统 之 间 的 交互 界定 为 一 种 社交 交换 意味 着 ， 那 些 在 传统 的 寻求 建议 关系 中 被 确定 为 有 影响 
力 的 重要 特性 ， 在 拟人 化 推荐 系统 交互 中 也 被 视 为 有 潜在 影响 力 。 


14.8 影响 


在 评价 推荐 系统 时 ， 理 解 相 关 特 性 的 影响 有 许多 理论 价值 和 实践 意义 。 从 理论 角度 
A, 经典 的 人 际 沟通 理论 需要 扩大 范围 和 应 用 来 理解 人 与 推荐 系统 的 关系 。' 通 过 应 用 经 典 
理论 ， 研 究 人 员 可 以 测试 并 分 析 人 与 推荐 系统 交互 的 多 个 方面 。 然 而 ， 当 应 用 这 些 理论 和 
开发 方法 论 来 测试 它们 时 ， 应 该 考虑 人 与 推荐 系统 交互 的 独 有 特质 。 进 一 步 ， 虽 然 推 荐 系 
统 相关 的 研究 中 存在 一 些 有 关 特 性 的 研究 ， 然 而 目前 这 些 并 不 系统 ， 甚 至 有 些 是 有 争议 
的 。 显 然 ， 在 这 一 领域 还 需 做 更 多 的 研究 以 便 构 建 一 个 强大 的 理论 框架 。 

从 实际 价值 角度 来 看 ， 理 解 推荐 系统 作为 拥有 影响 用 户 感知 特征 的 社交 参与 者 这 一 角 
色 ， 有 助 于 系统 开发 人 员 和 设计 人 员 更 好 地 理解 用 户 与 系统 之 间 的 交互 。 社 交 交 互 性 靠 用 
户 信 任 度 苗 壮 成 长 ， 同 时 也 受到 说 服 力 的 影响 。 在 “引导 偏好 的 方式 ”和 “得 出 推荐 的 方式 ” 
这 些 过 程 中 ， 用 户 越 富有 洞察 力 ， 那 么 一 个 推荐 系统 将 被 感知 到 更 高 的 可 信和 度 ， 同 时 也 越 
容易 被 接受 L43]。 混 合 系统 、 显 式 的 启发 并 且 能 够 让 用 户 控制 整个 过 程 似乎 是 非常 有 效 的 
策略 [113，114，138，16，137，101]j。SchaferL112] 提 出 的 动态 查询 接口 合并 了 偏好 接口 
和 推荐 引导 接口 ， 可 能 是 一 种 有 助 于 用 户 感觉 到 自己 在 操控 系统 的 方式 ， 因 为 这 种 动态 查 
询 接口 能 够 根据 用 户 偏 好 的 改变 即时 响应 。 在 推荐 系统 交互 中 ， 响 应 时 间 需 保持 简短 [8] 
和 搜索 过 程 细节 需 告 知 用 户 以 便 展 示 系 统 的 工作 [79，9，125]， 因 为 这 将 影响 可 信 度 感 
知 。 当 生成 推荐 结果 时 ， 更 常见 的 详细 产品 描述 推荐 L22] 和 关于 推荐 是 如 何 产生 的 相关 底 
层 逻 辑 的 解释 [133，48] 将 增加 用 户 对 系统 的 感知 可 信和 度 。 使 用 由 复杂 的 数据 挖掘 技术 所 
挖掘 的 历史 记录 和 模式 更 好 地 理解 用 户 系统 ， 将 帮助 系统 产生 更 多 熟悉 的 推荐 给 用 户 。 连 
同 推荐 产品 的 文本 描述 ， 推 荐 系统 设计 者 可 以 考虑 提供 虚拟 的 产品 体验 。Jiang 和 Benha- 
sat[56] 指 出 虚拟 产品 的 体验 提高 消费 者 的 产品 认 知 度 、 品 牌 态度 、 购 买 意愿 和 降低 感知 的 
风险 。 添 加 虚拟 产品 体验 不 仅 能 够 使 用 户 更 好 地 了 解 推荐 产品 ， 而 且 能 够 激 起 他 们 对 产品 
更 大 的 关注 、 兴 趣 和 乐趣 。 推 荐 系统 设计 人 员 还 应 注意 推荐 的 显示 格式 [128，142]。 当 推 
荐 呈现 给 用 户 时 ， 导 航 效果 和 设计 熟悉 度 以 及 吸引 力度 也 应 被 考虑 。 

最 重要 的 是 ， 研 究 推荐 系统 环境 中 相关 的 特性 为 可 信 的 和 有 说 服 力 的 推荐 系统 相关 设 
计 提 供 了 启发 。 设 计 面 临 的 挑战 是 寻找 如 相似 度 、 亲 和 力 和 权威 性 等 能 够 被 操作 并 转换 成 
具体 的 设计 特点 的 方法 ， 从 而 适用 于 推荐 系统 的 环境 。 例如， 呈现 系统 的 信任 权威 的 第 三 
方 印章 能 提高 系统 整体 的 信誉 度 。 通 过 引导 用 户 的 产品 偏好 和 选择 用 户 倾向 的 决策 策略 ， 
以 基于 需要 问题 的 使 用 ， 实 现 推荐 系统 和 用 户 之 间 的 相似 性 [138]。 通 过 不 同 的 沟通 风格 
和 声音 特征 来 操纵 推荐 系统 的 个 性 ( 像 外 向 或 内 向 ) 与 用 户 个 性 相 匹配 [49，80]j。 为 系统 接 
口 添加 一 个 嵌入 的 智能 体 ， 通 过 这 种 方式 ， 某 些 特征 更 容易 被 实现 。 骨 人 的 智能 体 作 为 系 
统 的 代理 人 ， 因 此 ， 强 调 系统 建议 提供 者 这 一 社交 角色 [141]。 语 音 接口 可 以 成 为 将 特性 
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转换 为 取得 信任 的 推荐 系统 设计 的 另 一 种 方式 。 

从 市 场 营销 的 角度 来 看 ， 创 造 出 具有 可 靠 性 和 诱导 性 的 推荐 系统 是 关键 ， 因 为 它 扮演 
着 与 实体 店 销售 员 类 似 的 角色 ， 即 需要 与 顾客 互动 以 及 根据 顾客 的 购买 情况 提供 建 
议 [134，62]。 因 此 ， 创 造 出 更 具 社交 化 和 更 值得 信赖 的 推荐 系统 将 有 助 于 市 场 营 销 人 员 
加 强 他 们 的 电子 化 服务 。 


14.9 未 来 研究 方向 


尽管 现 有 研究 已 经 在 人 与 推荐 系统 的 寻求 建议 关系 中 发 现 并 检测 了 很 多 有 影响 力 的 特 
性 ， 但 仍 有 通用 传播 理论 提出 的 许多 潜在 特性 没有 得 到 验证 ， 比 如 ， 权 威 性 、 关 怀 、 像 面 
部 表情 和 姿势 这 样 的 非 语言 行为 ， 以 及 幽默 。 在 未 来 推荐 系统 研究 中 ， 这 些 未 被 测试 的 特 
性 需要 被 成 功 地 实现 并 进行 实证 检验 。 

已 经 发 现 和 测试 的 特性 还 需要 被 精确 地 检测 。 对 于 判断 可 信和 度 的 作用 往往 是 较 复 杂 
的 ， 而 不 是 与 之 前 讨论 的 人 与 人 寻求 建议 的 过 程 中 发 现 的 影响 呈 线 性 关系 [99]。 因 为 情境 
因素 、 个 人 差异 以 及 产品 类 型 等 关系 在 决定 推荐 系统 的 可 信 度 性 时 也 能 扮演 重要 的 角色 ， 
所 以 从 设计 方面 考虑 ， 对 于 一 个 能 够 提供 精确 输入 的 特定 推荐 系统 来 说 ， 必 须 专门 对 这 些 
关系 进行 测试 。 

此 外 ， 可 能 会 存在 另外 的 特性 ， 它 们 对 寻求 人 际 关 系 的 影响 可 能 不 是 很 突出 ， 但 在 推 
荐 系统 领域 里 ， 却 是 要 被 考虑 的 重要 方面 。 例 如 ， 技 术 人 性 化 已 被 认识 到 是 在 技术 交互 中 
具有 重要 影响 的 特性 [60，96]， 但 却 不 是 影响 人 类 之 间 交 互 的 重要 特性 。 界 面 智能 体 的 真 
实 性 也 被 认为 是 一 个 潜在 的 有 影响 力 的 特性 。 有 证 据 表 明 : 本 来 用 户 会 更 倾向 于 和 拟人 化 
的 软件 角色 交互 ， 但 如 果 这 个 角色 设计 得 不 好 ， 用 户 进行 互动 的 意愿 也 不 会 强 ， 反 而 不 如 
一 个 设计 得 很 好 的 非 拟人 的 软件 角色 ， 如 狗 [59]。 在 未 来 的 研究 中 ， 这 种 额外 的 源 信号 需 
要 被 识别 和 测试 。 

目前 ， 一 些 特性 已 被 单独 地 测试 过 。 但 为 了 研究 它们 相互 作用 的 影响 ， 可 能 应 该 同时 
对 不 同 源 信号 进行 测试 。 这 将 有 助 于 理解 各 种 特性 之 间 的 联系 。 

总 而 言 之 ， 本 章 提 到 的 文献 表明 : 对 这 一 领域 的 研究 是 迫在眉睫 的 。 它 还 表明 ， 新 方 
法 可 能 需要 进一步 完善 以 研究 在 潜意识 层面 的 影响 。 特 别 地 ， 如 果 要 评估 具有 说 服 力 的 推 
荐 系统 ， 那 么 更 加 注重 对 推荐 结果 接受 行为 的 评估 似乎 是 有 道理 的 。 
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摘要 本章 全 面 描述 了 推荐 系统 的 解释 。 我 们 会 从 评估 的 角度 着 手 ， 也 就 是 说 ， 我 们 
感 兴趣 的 是 怎样 才 是 一 个 好 的 解释 ， 并 给 出 该 如 何 更 好 地 评估 该 解释 的 建议 。 我 们 发 现 解 
释 能 给 推荐 系统 带 来 7 个 好 处 ， 并 将 它们 和 评估 标准 相 联系 ， 以 及 如 何 将 它们 用 于 实际 推 
荐 系统 。 我 们 还 讨论 了 推荐 系统 的 呈现 方式 如 何 影响 其 解释 性 ， 以 及 交互 设计 所 扮演 的 角 
色 。 最 后 ， 本 章 还 描述 不 同类 型 的 解释 ， 以 及 相关 的 底层 算法 。 一 些 关 于 现 有 推荐 系统 解 
释 的 案例 会 贯穿 本 章 内容 。 


15.1 简介 


近年 来 的 研究 中 ， 对 于 推荐 系统 以 用 户 为 中 心 的 评价 研究 的 趋势 在 不 断 增 长 dnx 
献 L[42] 所 提 到 的 。 同 时 人 们 也 发 现 ， 很 多 推荐 系统 的 功能 如 同 黑 盒子 ， 不 能 透明 地 展现 出 
推荐 过 程 的 运行 进程 ， 除 了 推荐 系统 本 身 ， 也 不 能 提供 更 多 的 额外 信息 [42]。 

解释 可 以 使 隐藏 的 原因 和 数据 透明 化 。 这 是 在 亚马逊 主页 上 有 关 解 释 的 事例 ， 例 如 ， 
“购买 了 这 个 物品 的 用 户 也 购买 了 ……”。 解 释 还 能 够 达到 其 他 的 目标 : 比如 ， 增 加 用 户 的 信 
任 和 忠诚 度 ， 提 高 满意 度 ， 使 用 户 可 以 更 快 、 更 容易 地 找到 他 们 想 要 的 ， 本 章 将 区 别 不 同 的 
解释 : 如 解释 推荐 引擎 如 何 工 作 ( 透 明度 )， 或 解释 用 户 喜 欢 或 不 喜欢 某 个 物品 (有 效 性 )。 有 
效 解 释 可 以 用 这 种 方式 给 出 :“ 你 可 能 喜欢 (不 喜欢 ) 物 品 A， 因 为 ……”。 与 上 面 提 到 的 亚 马 
偿 的 例子 相 比 ， 这 个 解释 没有 描述 物品 是 如 何 被 推荐 的 ， 因 此 不 是 一 个 透明 的 解释 。 

15. 2 节 为 推荐 系统 解释 的 设计 和 评估 提供 了 一 些 指导 方针 。 专 家 系统 可 以 称 作 推荐 
系统 的 前 身 。 在 15. 3 节 会 简单 地 研究 专家 系统 解释 评估 和 推荐 系统 解释 评估 的 关系 。 随 
着 推荐 系统 的 发 展 ， 可 以 断定 过 去 专家 系统 对 解释 的 研究 可 能 会 再 度 兴起 。 

目前 为 止 ， 有 两 点 一 直 未 确定 : 如 何 评估 解释 ; 为 什么 要 解释 。 在 15.4 节 中 ， 列 出 
了 ?7 个 解释 标准 ， 并 说 明 其 在 过 去 系统 中 如 何 被 衡量 。 这 些 标准 也 可 以 被 理解 为 解释 给 推 
荐 系统 带 来 的 好 处 ， 并 回答 了 为 什么 要 解释 的 问题 。 关 于 解释 的 有 效 性 和 透明 性 ， 从 上 例 
中 可 以 看 到 这 两 个 评价 标准 可 能 是 相互 排斥 的 。 

在 15.5 节 ， 我 们 认为 底层 推荐 系统 会 影响 对 解释 的 评估 ， 并 根据 通常 用 于 推荐 系统 
的 评估 标准 (例如 准确 度 和 覆盖 率 ) 进 行 讨论 。 在 整 章 中 我 们 都 会 提 及 并 描述 一 些 有 关 解 释 
的 例子 ， 提 供 一 个 商业 和 学 术 推 荐 系统 实例 汇总 表 15.6。 将 以 文字 和 图 形 多 种 形式 展 
示 解 释 。 

此 外 ， 解 释 不 能 脱离 推荐 以 及 与 用 户 的 交互 : 二 者 相互 影响 ， 生 成 的 解释 又 能 反 过 来 
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影响 解释 的 目的 。 在 15. 6 节 中 讨论 这 些 类 型 的 设计 选择 。 在 15. 6. 1 节 中 ， 提 到 推荐 系统 
不 同 的 呈现 方式 ，15. 6. 2 节 讨 论 用 户 如 何 与 推荐 系统 交互 。 

此 外 ， 推 荐 引擎 的 底层 算法 可 能 会 影响 解释 类 型 ， 尽 管 有 开发 者 选择 的 解释 可 能 并 不 
反映 底层 的 算法 。 有 时 解释 的 算法 太 复 杂 ， 可 能 难以 用 于 生产 环境 ， 如 协同 过 滤 生 成 [29， 
31]。 在 这 种 情况 下 ， 开 发 者 必须 考虑 权衡 不 同 解释 的 目标 ， 如 满意 度 ( 可 理解 ) 和 透明 度 。 
在 15.7 节 中 ， 阐 述 了 最 常见 的 解释 风格 和 可 能 涉及 的 底层 算法 。 最 后 ， 在 15. 8 节 做 了 总 
结 并 讨论 了 未 来 的 发 展 方向 。 


15.2 指引 


本 章 的 内 容 分 为 以 下 几 个 部 分 : 

。 考虑 一 下 你 可 能 从 解释 里 获得 的 好 处 ， 以 及 为 了 评估 相关 标准 的 最 佳 衡量 方法 
(15.4 节 )。 

。 注意 有 关 解 释 的 评估 会 和 底层 推荐 引擎 的 作用 相 联系 ， 或 者 相 混淆 ， 就 像 评 估 推 
荐 系统 通常 所 采用 的 标准 所 衡量 的 那样 (15. 5 节 )。 

。 想 想 推荐 系统 的 展示 和 交互 是 如 何 互 相 影 响 解释 的 (15. 6 节 )。 这 些 因素 反 过 来 会 
影响 不 同 解释 目标 可 能 达成 的 程度 。 

。 最 后 ， 但 并 非 最 不 重要 的 ， 要 考虑 你 选择 的 解释 类 型 和 底层 算法 的 关系 (15. 7 
节 )。 它 们 能 否 达 到 解释 的 目标 ? 


15.3 专家 系统 的 说 明 


解释 在 智能 系统 上 的 运用 并 不 是 一 个 新 的 想法 : 解释 是 专家 系统 研究 的 一 部 分 [8，32， 
38，27，66]。 这 个 研究 主要 集中 于 能 够 给 出 什么 样 的 解释 以 及 如 何 实现 L[8，32，38，66]。 
总 体 来 说 ， 在 这 些 系 统 里 面 几乎 没有 对 解释 的 评估 。 过 去 对 解释 的 评估 主要 是 看 用 户 对 系统 
[15j( 如 其 给 出 的 结论 ) 的 认可 度 [67]。MYCIN 的 评估 是 个 例外 ， 它 将 系统 的 决策 支持 作为 
一 个 整体 考虑 [27]。 相 比 之 下 ， 在 专家 系统 中 ， 推 荐 系统 背后 的 商业 目的 是 面向 广大 用 户 群 
的 ， 这 一 点 既是 专家 系统 不 具备 的 ， 又 扩展 出 了 除 用 户 认可 度 外 的 解释 评估 目标 。 

在 20 世纪 90 年 代 专 家 系统 的 研究 热度 下 降 后 ， 推 荐 系统 的 发 展 重新 促进 了 对 解释 的 
研究 ， 其 中 一 个 发 展 是 由 网 络 带 来 的 大 数据 ， 现 在 有 越 来 越 多 的 用 户 使 用 推荐 系统 ， 系 统 
也 不 再 彼此 隔离 ， 使 代码 (开源 项 目 ) 和 数据 集 得 到 更 好 的 重用 ， 如 MovieLens[2] 和 
Netflix 数 据 集 [3]。 同 时 ， 算 法 的 优化 ， 特 别 是 协同 过 滤 已 经 被 广泛 使 用 和 发 展 ( 参 见 第 4 
章 和 第 5 章 ) 。 这 些 方法 减轻 领域 依赖 ， 具 有 更 大 的 普遍 性 ， 尤 其 适用 于 大 的 稀 朴 数据 集 。 
解释 研究 重新 兴起 的 一 个 标志 是 最 近 研 究 会 上 的 一 系列 解释 计算 取得 的 成 功 L53，54] 。 

进一步 的 阅读 ， 可 以 参看 专家 系统 对 三 个 最 常见 推理 方法 的 解释 综述 ， 基于 启发 式 方 
法 [36]， 贝 叶 斯 网 络 方法 [35]， 基 于 案例 的 推理 [22]。 


15.4 定义 的 目标 


指导 方针 1: 考虑 一 下 你 可 能 从 解释 里 获得 的 好 处 ， 以 及 为 了 评价 相关 标准 的 最 佳 衡 
量 方法 。 

参照 有 关 推 荐 系统 解释 的 文献 ， 我 们 看 到 推荐 系统 所 拥有 的 解释 能 力 会 根据 不 同 的 标 
准 进行 评估 ， 并 确定 了 7 个 不 同 的 目标 。 在 这 里 提 到 的 目标 ， 适 用 于 单个 物品 的 推荐 ， 即 
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在 提供 一 个 单一 建议 时 给 出 。 当 作 多 物品 推荐 时 ， 如 推荐 列表 ， 标 准 可 能 是 不 同 的 ， 需 要 
考虑 其 他 因素 (如 多 样 性 ) 。 

K 15. 1 明确 这 些 目标 ， 类 似 于 专家 系统 的 需求 (不 是 评估 )， 参 见 MYCIN[10]。 在 
表 15. 2 中 ， 我 们 总 结 以 前 对 推荐 系统 解释 的 评估 ， 以 及 评估 的 标准 。 这 些 没有 明确 标准 
的 工作 从 这 个 表 中 省 略 。 


15. 1 


说 服用 户 试用 或 购买 


允许 用 户 投诉 系统 错误 a S 帮助 用 户 更 快 地 做 决定 
增加 用 户 的 信任 增加 用 户 的 使 用 愉悦 性 
帮助 用 户 更 好 地 做 决定 | 


例如 ， 我 们 在 15. 3 节 提 到 对 专家 系统 常见 评估 是 用 户 认 可 度 和 整体 的 决策 支持 。 用 
户 的 认可 度 可 被 定义 为 满意 度 和 被 说 服 度 。 如 果 评 估 对 整个 系统 的 认可 度 ， 其 结果 就 反映 
了 用 户 满意 度 [15]， 比 如 ， 你 喜欢 这 个 程序 吗 ? 如 果 评 估 指 标 更 能 衡量 用 户 建议 或 解释 的 
接受 程度 ， 那 么 指标 就 是 说 服 度 ， 如 文献 [67]。 
明确 目标 的 区 别 是 很 重要 的 ， 即 使 它们 会 相互 作用 ， 或 需要 一 定 的 权衡 。 但 事实 上 ， 
很 难 给 出 一 个 满足 所 有 目标 的 解释 ， 这 实际 上 是 一 个 取舍 。 例 如 ， 研 究 发 现 个 性 化 的 解释 
可 能 会 增加 用 户 的 满意 度 ， 却 不 一 定 是 提高 有 效 性 [61]。 而 且 ， 看 似 有 内 在 联系 的 目标 实 
际 上 却 不 一 定 ， 例 如 ,已 经 发 现 透 明度 不 一 定 能 够 增加 解释 的 信任 度 [20]。 由 于 这 些 原 
因 ， 表 15. 2 中 的 解释 可 能 没有 通过 所 有 标准 的 评估 。 
表 15.2 推荐 系统 的 解释 标准 已 经 被 评估 出 来 。 这 些 推荐 系统 的 名 称 ( 如 果 有 ) 都 提 到 了 ， 否 则 我 们 只 标 
出 了 被 推荐 物品 的 类 型 。 没 有 明确 的 标准 规定 的 工作 ， 或 者 没有 用 他 们 所 规定 解释 标准 评估 过 


推荐 系统 的 工作 ， 都 从 这 个 表 中 略 去 了 。 请 注意 ， 尽 管 系统 在 几 个 标准 方面 都 做 了 评估 ， 但 它 
可 能 不 会 实现 所 有 的 标准 。 所 以 ， 为 了 完整 性 ， 我 们 已 经 区 分 了 使 用 相同 的 系统 的 多 个 研究 














Sat. 
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System(type of items) 
(Internet providers)[23] . 
(Digital cameras, notebooks computers) [49] 
(Digital cameras, notebooks computers) [50] 
(Music) [55] 
(Movies)[61] 
Adaptive Place Advisor (restaurants) [59] 
ACORN ( movies) [65 ] 
CH IP(cultural heritage artifacts) [19] 
CHIP(cultural heritage artifacts) [20] 
iSug gest-Usabilit y (music) [30] 
LIBRA(books)[11] 
MovieLens( movies) [29] 
Moviez plain( movies) [58] 
myCameraAdvisor( 63] 
Qwikshopl digital cameras) [39] 
SASY(e. g. holidays) [21] 
Tagsplanations( movies) ( 62] 
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解释 的 类 型 依赖 于 某 个 推荐 系统 设计 的 标准 。 例 如 ， 当 建立 一 个 售 书 系统 时 ， 用 户 的 
信任 是 最 重要 的 一 个 标准 ， 因 为 它 会 增加 用 户 的 忠诚 度 和 销售 额 。 对 于 视频 系统 ， 用 户 满 
意 度 比 有 效 性 更 加 重要 。 即 用 户 喜 欢 某 个 服务 比 呈 现 给 他 们 最 可 用 的 展示 要 重要 。 

此 外 ， 解 释 一 些 属性 可 能 有 助 于 实现 多 个 目标 。 例 如 ， 解 释 的 明白 程度 有 助 于 提高 用 
户 的 信任 以 及 满意 度 。 

在 本 章节 中 描述 了 有 关 解 释 的 7 个 标准 ， 并 且 建 议 了 基于 解释 器 以 前 评估 的 评估 方 
法 ,或 者 是 对 已 有 方法 如 何 适 应 评估 推荐 系统 中 的 解释 功能 给 出 了 建议 。 


15.4.1 系统 如 何 工 作 : 透明 性 


在 华尔街 杂志 上 有 篇 题 为 “如 果 TiVo 认为 你 是 同性 恋 ， 本 文 来 解释 它 的 原理 ”的 有 趣 
文章 ， 描 述 了 视频 播放 器 根据 观众 过 去 看 过 的 节目 ， 假 设 它 的 主人 会 喜欢 而 向 他 播放 节 
目 ， 做 出 不 相关 的 选择 ， 因 而 给 用 户 带 来 的 困扰 L69]。 例 如 ， 有 位 Iwanyk 先生 ， 怀 疑 他 
的 TiVo 认为 他 是 同性 恋 ， 因 为 TiVo 不 断 播放 同性 恋 相 关 题 材 的 节目 。 该 用 户 肯定 需要 
合理 的 解释 。 

一 个 解释 可 以 说 清楚 推荐 是 如 何 被 选择 的 。 在 专家 系统 中 ， 如 在 医疗 决策 领域 ， 透 明 
度 同 样 重要 [10]。 透 明 性 或 系统 状态 的 可 视 性 是 一 个 确定 的 可 用 性 原则 [44]j， 同 时 也 是 用 
户 推荐 系统 研究 的 一 个 重点 [55]。 

Vig 等 在 文献 [62] 中 区 分 了 透明 度 和 理由 。 虽 然 透 明度 要 求 对 于 如 何 选择 推荐 结果 以 
及 推荐 系统 如 何 工作 应 该 给 出 诚实 的 解释 ， 但 理由 可 以 是 描述 性 的 ， 并且 与 推荐 算法 解 
而 。 作 者 举 出 几 个 选择 理由 ， 而 不 是 透明 度 的 原因 。 例 如 ， 一 些 算法 难以 解释 (例如 ， 隐 
语义 分 析 中 的 因子 是 潜在 的 ， 没 有 清晰 的 解释 ) ， 系 统 设计 师 需 要 保护 商业 秘密 ， 并 且 渴 
望 在 解释 的 设计 里 获取 更 大 的 自由 。 

Cramer 等 研究 艺术 品 推 荐 系统 里 透明 度 在 其 他 评估 准则 上 的 作用 ， 如 信任 度 、 说 服 
度 和 满意 度 [L19，20]。 透 明度 的 评估 准则 是 : 感知 并 理解 系统 如 何 工作 [20]。 而 实际 的 感 
知 和 理解 是 基于 用 户 采 访 和 调查 问卷 。 

尽管 透明 度 和 被 理解 (15. 4. 2 节 )、 信 任 度 (15. 4. 3 节 ) 是 耦合 在 一 起 的 ， 但 我 们 将 会 
看 到 ， 它 们 的 标准 还 是 不 同 的 。 


15.4.2 允许 用 户 告 诉 系 统 它 是 错误 的 : 被 理解 


解释 可 能 有 助 于 隔离 和 纠正 被 误导 的 假设 或 步骤 。 当 系统 收集 和 解释 背景 的 信息 时 ， 
如 同 在 TiVo 的 案例 中 ， 对 于 用 户 来 说 推理 的 可 行 性 变 得 更 加 重要 。 透 明度 之 后 的 第 二 步 ， 
就 是 要 让 用 户 能 够 纠正 推论 ， 或 是 让 系统 能 够 被 理解 [21]。 解 释 应 该 是 周期 的 一 部 分 ， 用 
户 明白 在 系统 里 是 怎么 回 事 ， 在 系统 中 提出 建议 并 且 能 够 在 需要 时 纠正 系统 的 假设 [56]。 
可 理解 性 与 用 户 控制 [44] 的 确定 的 有 用 性 原则 相关 联 。 图 15. 1 为 一 个 可 理解 的 假期 推荐 
的 例子 。 

虽然 可 理解 与 透明 度 密 切 相 关 ， 但 应 该 被 唯一 地 标识 出 来 ( 见 表 15. 3) 。 表 15. 4 中 的 
解释 是 可 以 理解 的 ， 但 不 完全) 透明 ， 即 使 它们 提供 某 种 形式 的 理由 。 例 如 ， 在 该 表 中 ， 
没有 东西 标明 的 层 是 基于 贝 叶 斯 分 类 器 的 。 在 这 种 情况 下 ， 我 们 可 以 想象 一 个 用 户 试图 理 
解 一 个 推荐 系统 ， 并 设法 通过 修改 评分 来 改变 推荐 结果 ， 但 他 们 仍然 不 明白 到 底 系 统 底层 
发 生 了 什么 。 
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Here is the perfect holiday escape for Youl 
Wine Country Touring R 


Kick back, unwind and leave the rush of the oty behind. Enjoy à slow drive through 9 
|Auistraka's finest wine country, but don't drink and dnvel X 





图 15.1 可 理解 的 假期 推荐 L21]。 该 解释 位 于 画 圈 的 区 域 ， 用 户 的 属性 可 以 通过 “原因 ?链接 来 访问 


表 15. 3 ”关键 词 风格 解释 [11]， 该 推荐 的 解释 是 按照 已 经 使 用 描述 物品 关键 词 ， 以 及 有 关联 的 高 评分 物 
品 。 数 量 (Count) 描 述 关 键 词 出 现在 描述 物品 中 的 次 数 ， 优 点 (Strength) 描述 该 关键 字 预 测 物品 
喜好 的 程度 









Explain 


Explain 









BEAUTIFUL 





Explain 





MOTHER Explain 


Explain 





Explain 


表 15.4 在 点 击 表 15. 3 中 "解释 "之 后 将 会 展现 关键 字 " 优 点 "更 多 的 解释 。 实 际 上 ， 优 点 的 概率 度量 的 
是 关键 字 出 现在 积极 的 物品 中 比 出 现在 消极 的 物品 中 的 程度 。 其 基于 用 户 之 前 的 积极 评分 ， 以 
及 描述 这 些 物 品 的 关键 词 的 数量 








Hunchback of Notre Dame 


Victor Hugo, Walter J. Cobb 
C. S. Lewis, Fritz Eichenberg 
Oscar Wilde, Isobel Murray 


Czarkowski 发 现 用 户 本 身 不 容易 理解 这 些 ， 所 以 需要 额外 的 努力 来 使 得 理解 更 加 可 视 
化 [21]。 此 外 ， 让 用 户 通 过 改变 个 性 化 结果 来 理解 系统 会 更 容易 (如 “改变 个 性 化 结果 : 使 
4: 30—5 : 30 的 进度 表 中 只 包含 实时 节目 ”)。 他 们 的 评估 包括 像 任务 正确 性 这 样 的 衡量 
标准 ， 以 及 如 果 用 户 可 以 表达 一 些 信息 ， 什 么 信息 被 用 作对 他 们 的 推荐 。 他 们 明白 ， 推 荐 
结果 是 基于 他 们 的 个 人 属性 ， 即 系统 存储 的 他 们 的 个 人 资料 。 信 息 中 包含 他 们 自愿 的 信 
息 ， 并 且 可 以 通过 改变 它们 来 控制 个 性 化 [21] 。 





Till We Have Faces: A Myth Retold 





The Picture of Dorian Gray 


15.4.3 增加 用 户 对 系统 上 的 信任 : 信任 度 


信任 有 时 候 是 和 透明 度 相 关联 的 ， 以 往 的 研究 表明 ， 透 明度 和 用 户 与 推荐 系统 的 交互 
会 增加 用 户 对 系统 的 信任 [23，55]。 用 户 会 更 宽容 和 信任 ， 如 果 他 们 了 解 一 个 不 理想 的 扒 
荐 结果 是 如 何 产生 的 。 信 任 也 依赖 于 推荐 算法 的 精确 性 [41]。 对 用 户 的 信任 研究 表明 用 户 
打算 对 值得 信赖 的 推荐 系统 做 出 反馈 [16]。 然 而 ， 我 们 注意 到 ， 有 一 种 情况 下 ， 透 明度 和 
信任 是 不 相关 的 [20]。 
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我 们 并 不 认为 解释 完全 可 以 弥补 推荐 的 不 好 ， 但 很 好 的 解释 可 以 帮助 用 户 做 出 更 好 
的 决定 ( 见 15. 4. 5 节 效 果 )。 用 户 也 会 喜欢 系统 的 透明 性 以 及 承认 对 于 特殊 推荐 没有 
信心 。 

此 外 ， 一 个 推荐 系统 的 界面 设计 可 能 会 影响 其 信誉 。 在 确定 网 页 的 可 信 度 因素 的 研究 
里 ， 用 户 评论 占 比 最 大 (46. 1%) 的 是 网 络 的 整体 视觉 设计 : 包括 布局 、 字 体 、 字 体 大 小 和 
颜色 方案 [25]。 同 样 作者 照片 的 呈现 也 显著 影响 网 站 的 可 信和 度 [24]。 因 此 ， 推 荐 的 准确 性 
和 透明 性 关系 到 评估 的 可 信和 度 ， 同 时 设计 也 是 评估 中 需要 考虑 的 一 个 重要 因素 。 

问卷 可 用 于 确定 用 户 对 系统 的 信任 度 。 关 于 信任 问卷 的 概述 可 以 在 文献 L45] 中 找到 ， 
其 中 也 建议 并 验证 了 五 维 的 信任 级 别 。 请 注意 ， 这 个 验证 的 目的 是 利用 信誉 担保 产品 ， 而 
不 是 针对 某 个 特定 领域 进行 的 。 可 能 需要 更 多 的 验证 将 这 种 信任 级 别 适应 到 某 个 特定 的 推 
荐 领域 。 

推荐 系统 的 信任 模型 在 文献 [16，50j] 中 提出 ， 这 些 调研 的 问卷 调查 中 考虑 的 因素 包 
H: 是 否 愿意 对 系统 反馈 ， 是 否 提 升 了 效率 。 同 样 文献 [63j] 提 出 用 户 信 任 ， 但 是 关注 与 信 
念 相关 的 信任 ， 例 如 ， 一 个 虚拟 顾问 的 能 力 感 、 仁 慈 、 真 实 。 虽 然 问 卷 调查 可 以 非常 集 
中 ， 但 有 用 户 言 行 不 一 的 顾虑 。 在 这 些 情况 下 ， 隐 含 的 测试 (虽然 不 太 注 重 ) 可 能 揭示 一 些 
因素 ， 这 些 因 素 都 是 显 性 测试 目的 所 不 能 获得 的 。 

忠诚 ， 一 种 令 人 满意 的 信任 的 副产品 ， 可 能 是 这 样 的 一 种 隐 式 方法 。 有 研究 在 用 户 如 
何 影响 像 忠诚 度 这 样 因素 的 方面 ， 比 较 了 提取 用 户 偏好 的 不 同 界面 L41]。 它 使 用 用 户 登 录 
或 交互 的 次 数 来 衡量 其 忠诚 度 。 在 其 他 方面 ， 研 究 发 现 是 否 允许 用 户 评估 物品 会 影响 其 忠 
诚 度 。 亚 马 逊 是 一 种 保守 的 推荐 ， 主 要 通过 推荐 用 户 熟 悉 的 物品 ， 增 加 了 用 户 的 信任 和 自 
身 的 销售 [57]。 我 们 鼓励 那些 想 要 了 解 更 多 有 关 信 任 度 的 读者 去 阅读 第 20 章 ， 会 专门 讨 
论 该 话题 。 


15.4.4 ”说 服用 户 尝 试 或 购买 : 说 服 力 


解释 可 能 增加 用 户 对 系统 或 特定 推荐 [29] 的 接受 度 。 之 所 以 定义 为 说 服 力 ， 是 因为 这 
是 对 系统 的 效益 ， 而 不 是 用 户 。 你 的 邻居 对 这 部 电影 的 评分 

文献 [20] 按 照 在 最 终 六 个 最 喜爱 的 选 $ 
择 中 被 选中 的 推荐 数量 评估 推荐 物品 的 接 
受 性 。 在 协同 过 滤 和 基于 评分 的 电影 推荐 
系统 研究 中 ， 参 与 者 被 赋予 不 同 的 解释 界 
面 (图 15. 2)L29]j。 该 研究 直接 调查 用 户 面 
对 21 种 不 同 的 解释 界面 时 会 有 多 可 能 看 
一 部 电影 (识别 出 像 遗 漏 标题 这 样 的 特 ES COEM ; eu 
4E). Auk, HARA RELA Likert 级 别 1 和 2 3 4 和 5 





上 的 数值 评分 。 评分 
此 外 ， 如 果 物品 的 评估 发 生 了 变化 ， 

l 图 15.2 评估 说 服 力 的 21 个 个 界面 
也 就 是 用 户 在 收 到 解释 后 对 物品 的 评分 有 reaper elope ak EM. Pr 
所 不 同 ， 也 有 可 能 衡量 出 来 。 事 实 已 经 表 WE. ISSEHG. D. HEC), 3 
明 ， 用 户 可 以 被 操纵 给 出 接近 系统 的 预测 (2，1) 分 级 [29 | 


的 评分 [18]。 这 项 研究 是 在 电影 租赁 低 投 入 的 领域 ， 在 投入 成 本 领域 ， 如 相机 ， 用 户 就 可 


第 15 章 ”设计 和 评估 推荐 系统 的 解释 327 


能 不 那么 容易 受到 不 正确 预测 的 影响 。 也 需要 考虑 到 ， 一 旦 用 户 发 现 他 们 已 经 尝试 或 购 
买 一 些 他 们 不 想 要 的 ， 太 多 的 说 服 力 可 能 会 适得其反 。 

衡量 说 服 力 有 几 种 不 同 的 方法 。 例 如 ， 可 以 测量 在 两 种 评分 间 的 区 别 : 一 个 是 以 前 的 
评分 ， 另 一 个 是 带 有 解释 后 ， 对 相同 物品 的 重新 评分 [18]。 另 一 个 可 能 性 是 对 比 另 一 个 没 
有 解释 的 系统 ， 有 多 少 用 户 尝试 或 购买 物品 。 这 些 指 标 也 可 以 用 常用 的 电子 商务 的 “转化 
率 ” 概 念 。 操 作 上 定义 为 参观 者 采取 行动 的 百分比 。 想 更 深入 地 讨论 推荐 系统 说 服 力 的 读 
者 可 以 参考 第 14 章 。 


15.4.5 帮助 用 户 充 分 地 决策 : 有 效 性 


除了 简单 让 用 户 试用 或 购买 一 个 物品 ， 解 释 也 可 以 帮助 用 户 做 出 更 好 的 决策 。 有 效 性 根 
据 定义 来 看 高 度 依赖 推荐 算法 的 准确 性 。 一 个 有 效 的 分 析 能 帮助 用 户 根据 自己 的 喜好 评估 推 
荐 物品 的 质量 。 这 将 帮助 他 们 识别 有 用 物品 而 丢弃 无 
关 选 项 。 例 如 ， 一 个 有 效 的 图 书 推荐 系统 可 以 帮助 用 
户 购 买 他 们 最 终 喜 欢 的 书籍 。Bilgic 和 Mooney 强调 一 
种 测量 系统 来 帮助 用 户 基于 解释 做 出 对 推荐 结果 的 准 
确 决 策 ， 如 图 15.3 和 表 15.3、 表 15.4 和 表 15.5 " 
[11]。 有 效 的 解释 也 适合 于 新 类 型 产品 ， 或 新 用 户 ， 图 15. 3 ”邻居 风格 解释 。 直 方 图 总 结 类 似 


用 户 的 评级 ( 相 邻 的 ) 的 推荐 物 
因而 帮助 他 们 理解 全 部 选项 [23 49]. Don i qu 





Vig 等 衡量 了 已 感知 的 有 效 性 :“ 解 释 帮 助 确定 (3)， 差 (2，1)[29]。 与 图 15.2 
我 会 喜欢 这 部 电影 .”"L62]。 解 释 的 有 效 性 也 可 以 通 类 似 ， 该 研究 也 是 有 意 强调 并 且 
过 用 户 在 消费 推荐 物品 之 前 和 之 后 喜爱 程度 的 差异 突出 劝说 性 和 解释 之 间 的 区 别 


来 计算 。 例 如 ， 在 以 前 的 研究 中 ， 用 户 两 次 评估 一 本 书 ， 一 次 是 在 得 到 解释 时 ， 另 一 次 是 
在 读 它 时 [11]。 如 果 他 们 对 这 本 书 的 意见 没有 多 大 变化 ， 该 系统 被 认为 是 有 效 的 。 这 项 研 
究 探 讨 了 整个 推荐 过 程 ， 包 括 解 释 ， 对 于 有 效 性 的 影响 。 相 同 的 衡量 方法 也 被 用 于 评估 个 
性 化 解释 (独立 于 推荐 系统 ) 是 否 能 在 电影 领域 提高 有 效 性 [61] 。 

虽然 这 种 衡量 方法 考虑 了 评分 前 后 的 差异 ， 它 没有 讨论 过 低估 计 会 产生 的 效果 。 如 果 
公开 一 个 物品 ， 用 户 的 评估 减少 ， 那 么 他 们 的 初始 评分 是 一 个 高 估 的 信息 。 同 样 ， 如 果 他 
们 的 评估 在 物品 公开 后 增加 ， 那 初始 评分 被 低估 。 在 我 们 的 工作 中 发 现 ， 用 户 认为 高 估 的 
有 效 性 比 低估 的 有 效 性 少 ， 它 存在 于 各 种 不 同 领域 之 间 。 特 别 是 过 高 估计 在 高 投入 领域 比 
低 投入 领域 更 为 严重 。 此 外 ， 对 感知 效果 影响 的 强度 取决 于 预测 误差 发 生 的 规模 大 小 
[60]. 

另 一 种 衡量 解释 有 效 性 的 方法 是 ， 评 测 同样 的 系统 在 有 或 没有 解释 机 制 下 ， 评 估 收 到 
解释 的 受 试 者 是 否 能 最 终 找到 更 适合 他 们 个 人 品位 的 物品 L19]。 

其 他 评估 解释 有 效 性 的 工作 采用 了 来 自 营销 领域 的 衡量 方法 [28]， 以 找到 一 个 可 能 最 
好 的 物品 为 目的 (而 不 是 以 上 的 “足够 好 的 物品 ”)[17]。 参 与 者 与 系统 相互 作用 ， 直 到 他 们 
找到 想 要 购买 的 物品 。 然 后 他 们 被 给 予 机 会 去 检查 整个 目录 以 及 改变 他 们 所 选 物品 的 选 
项 。 一 部 分 找到 好 物品 的 参与 者 会 被 用 来 测量 效果 ， 这 一 部 分 被 选 的 参与 者 是 通过 比较 数 
据 库 中 所 有 的 参与 者 选择 出 来 的 。 因 此 ， 使 用 这 种 度量 ， 低 分 数 代表 高 有 效 性 。 

有 效 性 这 个 标准 与 精度 测量 最 为 相关 ， 如 准确 率 和 召回 率 [19，58，59]j。 对 于 那些 快 


OG 文献 [60] 中 记录 了 他 们 发 现 ， 相 对 低 成 本 领域 ， 在 高 成 本 领域 不 正确 的 过 高 估计 的 用 处 更 少 。 
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消费 物品 的 系统 ， 这 些 衡量 标准 可 以 转化 为 分 别 识别 相关 物品 和 丢弃 不 相关 选项 。 例 如 ， 
有 一 种 替代 “准确 率 ” 的 衡量 标准 是 ， 匹 配 用 户 兴趣 的 概念 数量 ， 与 用户 个 人 信息 中 的 概念 
总 数 之 比 [L19j。 


15. 4. 6 帮助 用 户 快速 制定 决策 : 效率 


解释 可 以 使 用 户 更 快 地 决定 哪些 建议 物品 对 他 们 来 说 是 最 好 的 。 效 率 是 另 一 个 确定 的 
可 用 性 原则 ， 即 如 何 快速 地 执行 任务 [44]。 如 果 推 荐 系统 要 做 的 事情 是 在 大 海 捞 针 ， 那 么 
这 个 准则 是 所 有 推荐 系统 文献 中 都 要 解决 的 问题 。 

帮助 用 户 理 解 相 互 矛盾 的 选项 之 间 的 关系 有 助 于 提高 效率 。[39，43，49] 采 用 所 谓 的 
评价 算法 就 能 很 好 地 生成 解释 ， 该 算法 是 在 物品 属性 之 间 进 行 权 衡 的 基于 知识 算法 的 一 个 
子 集 。 如 在 数字 相机 领域 ， 选 项 相互 冲突 的 例子 可 能 是 :“ 低 内 存 、 低 分 辨 率 、 便 宜 ”[39]。 
这 样 如 果 用 户 满足 于 一 个 配置 为 低 内 存 、 低 分 辨 率 的 相机 ， 可 以 通过 这 个 查询 修正 迅速 找 
到 一 个 便宜 的 相机 。 基 于 评价 的 推荐 系统 更 多 的 细节 在 第 13 章 有 详细 的 描述 。 

效率 经 常 被 用 来 评估 会 话 式 推 荐 系统 ， 该 系统 可 以 使 用 户 与 推荐 系统 进行 交互 ， 同 时 
细 化 他 们 的 偏好 (参见 15. 6. 2 节 )。 在 这 些 系 统 中 ， 可 以 在 对 话 中 看 到 隐 含 的 解释 。 效 率 
可 以 通过 用 户 在 交互 完成 时 找到 满意 物品 的 情况 下 所 花费 的 总 时 间 和 交互 次 数 来 计算 [59]。 
根据 效率 提升 来 评估 解释 的 作用 并 不 限于 会 话 式 系统 。 举 个 例子 ，Pu 和 Chen 不 仅 比较 了 
两 个 解释 界面 的 完成 时 间 ， 并 且 将 完成 时 间 衡 量 为 参与 者 在 界面 中 定位 到 所 需 产 品 花 费 的 
时 间 [49]。 

当 没 有 合适 的 物品 呈现 时 ， 对 效率 的 度量 方式 包括 检查 解释 的 次 数 和 主动 修正 行为 的 
次 数 [23，52]。 向 用 户 显示 所 有 可 能 的 推荐 结果 及 相关 解释 是 明智 的 ， 这 样 可 以 使 用 户 通 
过 解释 详细 地 浏览 物品 。 在 更 高 效 的 系统 中 ， 用 户 只 需要 检查 少量 解释 。 修 正 行为 来 自用 
户 的 反馈 ， 用 于 改变 用 户 看 到 的 推荐 物品 ， 如 可 理解 性 (15.4. 2 节 ) 所 总 结 的 。 用 户 反 馈 
或 者 行为 修正 的 实例 可 以 在 15. 6. 2 节 中 找到 。 


15.4.7 使 系统 的 应 用 愉悦 : 满意 度 


人 们 发 现 解释 可 以 提高 用 户 对 推荐 系统 的 满意 度 或 接受 程度 [23，29，55]。 对 物品 进 
行 详细 的 描述 既 利 于 用 户 的 体验 [60]， 又 使 得 推荐 系统 方便 使 用 [55]。 另 外 ， 很 多 商业 推 
荐 系统 来 源 于 娱乐 领域 ， 如 表 15.6 所 示 ， 在 这 种 情况 下 ， 所 有 额外 的 机 制 都 应 致力 于 提 
高 用 户 满意 度 。 表 15.4 给 出 了 在 满意 度 维度 上 对 解释 评估 的 例子 。 

当 衡量 满意 度 的 时 候 ， 一 方面 可 以 直接 咨询 用 户 该 系统 是 否 是 易 用 的 [15]， 另 一 方面 
判断 用 户 是 否 喜 欢 这 些 解释 [60]。 满 意 度 也 能 间接 地 通过 用 户 忠 诚 度 衡量 (详细 部 分 见 
15.4.3 节 )[41，23]， 或 者 通过 判断 该 系统 是 否 能 用 来 完成 搜索 任务 [20]。 

在 衡量 解释 的 满意 度 时 ， 区 分 用 户 是 对 推荐 的 过 程 满 意 还 是 对 推荐 的 产品 ?满意 很 重 
要 [20，23]。 衡 量 推荐 过 程 满意 度 的 一 种 定性 方法 是 进行 可 用 性 测试 ， 比 如 ， 用 有 声 思 维 
法 记录 用 户 执 行 某 个 任务 [37]。 

在 以 下 这 个 例子 中 ， 参 与 者 在 执行 一 个 任务 ， 比 如 ， 找 到 一 个 满意 的 物品 ， 他 们 使 用 
系统 描述 他 们 的 整个 经 历 ， 包 括 看 了 什么 、 想 了 什么 、 做 了 什么 和 感觉 如 何 。 系 统 不 以 任 


日 。 这 里 指 的 是 整个 推荐 过 程 ， 包 括 解释 。 然 而 在 15. 5 节 ， 我 们 会 强调 指出 推荐 系统 中 解释 的 评估 很 少 完全 独 
立 于 基本 的 推荐 过 程 。 
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何 解释 或 其 他 方式 影响 用 户 ， 使 其 客观 地 记录 一 切 。 视 频 和 语音 录音 也 可 以 用 于 再 次 查看 
会 话 或 者 作为 记忆 辅助 物 。 在 这 种 情况 下 ， 有 可 能 发 现 可 用 性 问题 ， 甚 至 采用 定量 的 度量 
标准 ， 如 正面 评论 和 负面 评论 的 比例 ， 评 估 者 感到 诅 丧 的 次 数 ， 评 估 者 感到 高 兴 的 次 数 ， 
评论 者 在 什么 地 方 遇 到 了 可 能 存在 的 问题 及 遇 到 的 次 数 等 。 

我 们 认为 用 户 也 会 满意 将 两 种 标准 混合 起 来 的 高 效 解释 系统 。 然 而 ， 一 个 能 帮助 用 户 
做 决策 的 系统 ， 可 能 会 降低 系统 整体 的 满意 度 ( 如 需要 大 量 对 用 户 的 认 知 工作 )。 幸 运 的 
是 ， 这 两 个 标准 可 以 通过 不 同 的 指标 进行 衡量 。 


15.5 评估 解释 在 推荐 系统 的 作用 


指导 方针 2: 采用 通常 用 于 评估 推荐 系统 的 标准 来 衡量 ， 对 于 解释 的 评估 会 与 底层 推 
荐 引擎 的 功能 有 某 种 关联 ， 甚 至 会 相互 混淆 。 

我 们 发 现 有 7 个 标准 可 以 衡量 推荐 系统 的 解释 效果 ， 这 里 给 出 了 可 以 用 于 评估 的 建 
议 。 在 某 种 程度 上 ， 这 些 评估 标准 可 以 评估 用 于 解释 的 组 件 ， 评 估 整 个 系统 似乎 也 是 合理 
的 。 这 种 情况 下 ， 我 们 会 衡量 一 般 系 统 的 可 用 性 和 准确 性 ， 这 些 系统 同时 依赖 于 推荐 算法 
和 解释 组 件 。 因 此 ， 在 这 一 部 分 中 ， 我 们 描述 推荐 系统 和 解释 标准 之 间 的 交互 时 ， 常 用 的 
参数 有 精准 度 、 学 习 效 率 、 覆 盖 率 、 新 颖 性 /惊喜 度 和 接受 度 。 


该 推荐 结果 的 理由 如 下 : Prediction for Sixth Sense, The(1999) 
。 这 类 连接 的 网 络 空间 是 可 用 的 ; In Dopth MovieLens 





。 对 您 来 说 ， 这 个 包 是 可 以 连接 到 您 的 任意 一 个 位 置 ; Prediction Confidence 
。 网 络 连接 的 月 消费 超出 您 的 预算 。 ooo ke x ook xk 





图 15.4 一 个 互联 网 服务 提供 商 的 解释 ， 描 述 了 提供 物 图 15.5 推荐 结果 的 可 信 度 [29] 一 一 该 电影 


品 的 用 户 需求 :“ 该 结果 由 以 下 原因 得 出 …… ” 是 强烈 推荐 的 ， 并 且 有 大 量 的 信息 
[23] 支撑 着 该 推荐 结果 
15.5.1 精准 度 


精准 度 代表 推荐 系统 在 预测 方面 的 能 力 ， 但 是 也 会 与 解释 有 关 。 例 如 ， 就 精准 度 与 透 
明度 的 关系 而 言 ，Cramer 等 发 现 透明 度 会 改变 用 户 的 行为 ， 最 终 降 低 精 准 度 [19] 。 

推荐 系统 自身 的 可 信和 度 与 精准 度 也 有 关系 ， 并 且 能 在 解释 中 体现 。 例 15. 5 中 可 信 度 
的 展示 旨 在 帮助 用 户 理解 精准 度 。 这 些 可 以 用 来 解释 不 好 的 推荐 结果 ， 如 那些 没有 足够 的 
信息 来 形成 的 推荐 结果 。 进 一 步 有 关 可 信 度 方面 工作 的 介绍 可 以 参见 文献 [40] 。 

解释 能 够 帮助 用 户 了 解 如 何 对 待 一 个 特定 的 推荐 结果 ， 可 能 提供 的 额外 信息 能 帮助 用 
户 做 出 明智 的 选择 并 提高 效率 。 在 精准 度 很 低 的 情况 下 ， 会 导致 丢失 好 的 推荐 结果 而 坏 结 
， 果 增加 的 风险 ， 然 而， 解释 可 以 降低 这 种 风险 。 通 过 帮助 用 户 识别 推荐 结果 的 好 坏 ， 整 体 
推荐 系统 的 准确 度 也 会 提升 。 


15. 5.2 学 习 效 率 


学 习 效率 标志 着 推荐 系统 对 用 户 偏 好 变化 的 敏感 程度 。 当 一 个 用 户 希望 推荐 系统 能 快 
速 学 习 到 他 们 的 喜好 ， 对 待 短期 兴趣 也 能 像 长 期 兴趣 一 样 敏感 时 ， 学 习 效率 会 影响 用 户 的 
满意 度 。 解 释 可 以 通过 暗示 用 户 系统 注意 到 了 其 偏好 的 变化 来 提高 满意 度 。 例 如 ， 系 统 可 
以 给 一 个 给 定 的 变量 标记 一 个 值 ， 使 得 它 因为 改变 而 越 来 越 接近 阔 值 ， 但 还 没 达到 该 阔 


330 ”第 三 部 分 推荐 系统 的 影响 


值 。 系 统 还 可 以 使 用 户 了 解 它 是 如 何 学 习 并 改变 偏好 的 (透明 度 )， 其 至 可 以 允许 用 户 修改 
他 们 的 旧 偏 好 (可 理解 性 )。 解 释 机 制 可 以 请 求 一 些 信息 帮助 系统 更 快 地 学 习 或 者 改变 ， 如 
可 以 询问 用 户 对 电影 类 型 的 喜好 是 否 从 动作 片 转移 到 了 喜剧 片 。 


15.5.3 BRE 


覆盖 度 标识 着 推荐 系统 推荐 结果 的 覆盖 能 力 。 解 释 能 够 帮助 用 户 了 解 他 们 的 搜索 空间 
大 小 。 在 探索 搜索 空间 中 ， 解 释 能 帮助 用 户 选择 信息 丰富 的 物品 ， 这 能 增加 部 分 物品 或 者 
特征 的 重 簿 (与 稀疏 性 相对 ) 。 最 终 ， 这 会 为 潜在 的 推荐 增加 总 体 覆 盖 度 。 理 解 剩 下 的 搜索 
选项 与 透明 度 标 准 有 关 : 推荐 系统 可 以 解释 为 什么 某 些 物品 没有 被 推荐 。 或 者 不 可 能 ， 或 
者 难以 检索 该 物品 (例如 ， 物 品 在 基于 内 容 的 系统 中 有 一 个 特别 的 属性 ， 或 者 在 协同 过 滤 
系统 中 没有 足够 的 点 击 量 )。 此 外 ， 推 荐 系统 可 能 基于 用 户 对 该 物品 不 感 兴趣 的 基础 上 设 
计 函 数 ( 例 如 ， 如 果 用 户 的 需求 在 基于 内 容 的 系统 中 太 狭 窗 ， 或 者 在 协同 过 滤 系 统 中 属于 
小 众 口 味 ) 。 一 个 解释 能 说 明 为 什么 该 物品 对 推荐 系统 是 不 可 用 的 ， 甚 至 能 说 明 如 何 补救 
这 种 情况 并 且 多 许 用 户 改变 他 们 的 喜好 (可 理解 性 ) 。 

覆盖 度 可 能 会 影响 有 效 性 的 解释 标准 的 评估 。 例 如 ， 一 个 用 户 不 是 要 找到 一 个 足够 好 
的 结果 ， 而 是 要 找到 一 个 最 好 的 结果 ， 那 么 覆盖 度 需要 确保 这 最 好 的 结果 在 推荐 结果 中 。 
取决 于 检索 物品 集合 的 速度 ， 覆 盖 度 也 会 影响 效率 。 


15.5.4 接受 度 


人 们 可 能 会 将 对 一 个 系统 的 接受 度 或 满意 度 ， 与 其 他 类 型 的 满意 度 相 混淆 。 如 果 一 个 
用 户 对 一 个 有 解释 组 件 的 推荐 系统 满意 ， 我 们 仍然 不 清楚 用 户 是 满意 解释 组 件 ， 还 是 满意 
推荐 系统 ， 或 者 满意 整体 设计 风格 和 视 党 吸引 力 。 对 系统 的 满意 度 与 推荐 精准 度 紧 密 相 
连 ， 甚 至 与 新 颖 性 和 多 样 性 相连 ， 从 某 种 意义 上 说 ， 要 有 足够 好 的 推荐 结果 才能 满足 用 户 
需求 。 虽 然 解释 能 帮助 系统 提高 满意 度 ， 但 是 他 们 不 能 替代 一 个 好 的 精准 度 。 事 实 上 ， 这 
适用 于 所 有 的 解释 标准 。 一 个 符合 满意 度 标准 的 解释 例子 如 下 :“ 请 完全 向 我 展示 ， 在 为 
您 做 出 精准 推荐 之 前 ， 我 需要 学 习 更 多 关于 你 的 偏好 。” 


15.6 用 推荐 设计 展示 与 互动 


指导 方针 3: 思考 以 下 几 个 问题 : 如 何 展 示 推 荐 结果 ， 如 何 展示 交互 模型 ， 如 何 展示 
互相 的 影响 以 及 如 何 展示 解释 。 这 些 因素 将 影响 解释 达到 目标 的 程度 。 

展示 推荐 结果 的 方式 可 能 会 影响 交互 模型 ， 而 该 模型 可 以 提取 到 用 户 的 偏好 情况 。 同 
样 ， 以 上 两 个 因素 会 影响 解释 的 生成 。 换 名 话说， 一 些 解释 的 生成 可 能 更 适合 特定 的 解释 
标准 。 第 16 章 同 样 讨论 了 面向 个 性 化 推荐 系统 的 一 个 互补 的 评估 框架 (如 在 第 13 章 中 描 
述 了 评价 机 制 )， 重 点 在 于 设计 推荐 的 展示 和 交互 的 模型 。 例 如 ， 一 个 指导 方针 描述 的 ; 
“同时 展示 一 个 搜索 结果 或 者 推荐 一 个 物品 可 以 简单 并 适合 展示 在 一 个 小 的 显示 器 上 ; R 
而 ， 这 样 却 可 能 让 用 户 停留 在 更 长 的 交互 会 话 中 ， 或 者 仅 允 许 他 们 得 到 相对 低 的 决策 精 
度 。”( 详 见 指导 方针 9。) 


15.6.1 展示 推荐 
我 们 总 结 一 下 在 本 书 中 出 现 过 的 推荐 展现 方式 。 用 户 图 形 界面 的 外 观 有 很 多 种 方式 ， 
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提供 推荐 的 实际 结果 也 各 不 相同 。 我 们 定义 以 下 几 种 组 织 推荐 结果 展现 形式 的 类 别 : 


最 优 物品 。 或 许 展示 推荐 的 最 简单 的 方式 就 是 为 用 户 提供 最 优 物品 。 例 如 ,“ 您 曾 
经 看 过 很 多 运动 相关 物品 ， 尤 其 是 足球 类 的 。 这 个 是 世界 杯 期 间 最 流行 且 最 新 的 
最 优 N 物品 。 系 统 也 可 能 一 次 展示 多 个 物品 。“ 你 看 了 很 多 足球 类 和 科技 类 物品 。 
你 可 能 会 喜欢 看 当地 的 足球 结果 和 当天 的 科技 新 产品 ”注意 这 个 系统 能 解释 物品 
之 间 的 关系 ， 它 也 可 以 解释 每 个 单项 背后 的 理由 。 

最 优 项 相似 物品 。 一 旦 用 户 表现 出 了 一 个 或 多 个 偏好 ， 推 荐 系统 能 够 提供 类 似 的 
物品 。 如 "你 可 能 还 喜欢 …… 查 尔 斯 "狄更斯 的 4 雾 都 孤儿 》。” 

为 所 有 的 物品 预测 并 评级 。 系 统 允 许 用 户 浏览 所 有 可 用 的 物品 ， 而 不 是 强迫 用 户 
做 出 选择 。 推 荐 是 通过 为 每 一 项 预测 评分 后 被 推出 的 (分 值 从 0 到 5)。 用 户 可 以 查 
询 如 当地 曲棍球 这 样 的 物品 为 什么 被 预测 了 一 个 很 低 的 分 值 。 推 荐 系统 最 后 生成 
如 下 的 解释 :“ 这 虽然 是 一 项 运动 ， 但 和 曲棍球 相关 ， 你 可 能 并 不 喜欢 它 。 

结构 概览 。 推 荐 系统 能 提供 一 种 结构 ， 实 现在 物品 之 间 进 行 切换 的 功能 L49，68]。 
结构 要 的 好 处 是 用 户 可 以 看 到 物品 之 间 的 比较 如 果 当 前 推荐 结果 不 能 满足 需 
求 ， 其 他 结果 仍然 可 用 。 


15.602 与 推荐 系统 交互 


用 户 可 以 通过 不 同 的 方法 向 推荐 系统 提供 信息 。 交 互 可 以 区 分 为 会 话 式 系统 和 单 向 推 
荐 系统 。 他 们 人 允许 用 户 通 过 一 个 扩展 对 话 框 提交 复杂 的 需求 [51]， 而 不 是 每 个 用 户 的 交互 
独立 于 以 前 的 历史 记录 单独 处 理 。 

我 们 提供 当前 应 用 程序 的 例子 ?， 用 于 拓展 四 个 方面 的 建议 L26]。 注 意 尽 管 有 更 多 的 
方法 来 获取 用 户 偏好 ， 如 通过 使 用 数据 [46] 或 者 人 口 分 布 L6]， 本 节 的 重点 在 于 用 户 的 显 


式 反馈 。 


用 户 指 定 他 们 的 需求 。 用 户 能 够 用 简单 的 英语 通过 对 话 来 指定 他 们 对 偏好 的 需求 
[43，64]。 这 样 的 一 个 对 话 不 用 于 用 户 以 前 的 兴趣 上 ， 也 不 用 于 直接 的 解释 上 。 
也 就 是 说 ， 没 有 词句 可 以 生成 推荐 理由 。 然 而 ， 它 是 间接 的 ， 通 过 重复 满足 用 户 
的 需求 。 

用 户 请 求 换 一 换 。 一 个 更 直接 的 办 法 是 允许 用 户 显 式 地 评价 推荐 系统 ( 见 第 13 章 
的 评价 的 改进 ) ， 例 如 ， 使 用 结构 化 概览 ( 见 15.6.1 节 )。 一 个 这 样 的 系统 可 以 解 
释 物 品 和 剩余 物品 之 间 的 区 别 [39]。 

用 户 给 物品 评分 。 为 了 改变 他 们 得 到 的 推荐 结果 的 类 型 ， 用 户 可 能 想 纠正 预测 评 
分 ， 或 者 改变 过 去 的 一 个 评分 。 表 15. 5 中 基于 解释 的 影响 表明 ， 评 分 标题 是 影响 
推荐 书籍 的 最 重要 因素 [11] 。 

用 户 提供 他 们 的 意见 。 常 见 的 可 用 性 原则 比 从 内 部 描述 更 容易 使 人 了 解 推荐 物品 。 
例如 ， 如 果 一 个 用 户 想 了 解 更 多 类 似 的 物品 或 者 他 们 曾经 已 经 看 过 该 物品 ， 则 可 
以 指定 这 个 物品 在 他 们 看 来 是 否 有 趣 [12，57] 。 

混合 交互 界面 。 推 荐 系统 也 可 以 结合 不 同类 型 的 交互 L17，41] 。 


五 分 之 一 的 关于 混合 交互 接口 的 内 容 添加 到 了 这 个 原始 列表 中 。 
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表 15.5 基于 解释 的 影响 表明 评分 标题 对 推荐 数据 影响 力 最 大 。 尽 管 这 个 系统 不 允许 用 户 修改 以 前 的 评 
级 或 者 影响 程度 ， 但 是 可 以 直接 在 解释 界面 更 改 评分 。 然 而 注意 一 点 ， 修 改 影 响 程度 会 比较 困 
难 ， 因 为 该 值 是 通过 计算 得 来 的 : 任何 修改 都 会 干扰 常规 的 推荐 算法 函数 [11] 


书 名 您 的 评分 (总 分 5 分 ) 影响 力 (总 分 100 分 ) 
Of Mice and Men | 54 
Till We Have Faces; A Myth Retold 50 
Crime and Punishment 46 
15.7 解释 风格 


指导 方针 4: 考虑 底层 算法 和 你 选择 生成 解释 的 类 型 之 间 的 关系 。 你 生成 的 解释 能 帮 
你 达到 解释 效果 吗 ? 

在 该 部 分 我 们 描述 基于 特定 底层 算法 的 解释 方式 或 者 不 同 的 “解释 风格 ”。 注 意 一 点 ， 
无 论 推 荐 结果 是 如 何 被 检索 或 者 计算 得 来 的 ， 解释 风 格 可 能 与 特定 算法 无 关 。 换 句 话说 ， 
解释 风格 可 能 会 ， 也 可 能 不 会 反映 出 计算 出 推荐 结果 的 底层 算法 。 推 荐 是 如 何 被 检索 出 来 
的 与 解释 风格 是 如 何 生成 的 两 者 之 间 经 常 有 分 歧 。 因 此 ， 这 种 类 型 的 解释 与 透明 度 的 目标 
可 能 不 一 致 ， 但 是 或 许 会 支持 其 他 的 一 些 解释 性 目标 。 

透明 度 并 不 是 决定 解释 风格 的 唯一 标准 。 例 如 ， 对 于 一 个 特定 的 推荐 系统 ， 相 比 效果 
好 的 基于 评价 的 解释 ， 用 户 更 喜欢 基于 内 容 的 解释 。 然 而 ， 在 解释 风格 和 解释 目标 之 间 几 
PRAXI. RA HingstonL30] 比 较 了 不 同 受 算 法 诱导 的 解释 风格 之 间 的 可 理解 性 和 可 读 
性 ， 在 这 些 例子 中 ， 解 释 也 直接 受 底层 算法 影响 。 然 而 其 他 研究 基于 不 同 的 解释 目标 研究 
了 不 同 的 解释 界面 [20，29，61] 。 

尽管 推荐 引擎 的 底层 算法 在 一 定 程 度 上 会 影响 解释 类 型 的 生成 。 表 15.6 总 结 了 最 常 
用 的 解释 风格 (案例 、 协 同 、 内 容 、 会 话 、 人 口 统计 、 基 于 知识 /自然 语言 ) 并 附 有 例子 ， 
在 这 部 分 我 们 描述 每 一 种 风格 ， 包 括 他 们 的 输入 、 处 理 过 程 及 生成 的 解释 。 在 商业 系统 中 
这 些 信 息 都 不 是 公开 的 ， 我 们 提供 一 些 学 术 上 的 猜测 。 虽 然 会 话 式 系统 也 包含 在 这 个 表 
中 , 但 是 我 们 认为 会 话 系统 比 某 个 特定 算法 具有 更 多 的 交互 样式 。 


表 15.6 商业 和 学 术 系 统 的 解释 实例 ， 按 照 解释 风格 排序 (案例 、 协 同 、 
内 容 、 会 话 、 人 口 统 计 、 基 于 知识 /自然 语言 ) 


T LIT 

Tne is 
l3 15 5 

LIBRA[11] ea picis fee 15.4), 邻居 风格 ( 见 表 协同 


MovieLens[ 29] 邻近 者 ( 见 表 15.2) 和 信任 度 ( 见 表 15. 5) 直 方 图 协同 
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系统 解释 实例 解释 风格 
Amazon. com “因为 您 告诉 我 们 您 有 书籍 A” 内 容 


“为 什么 为 您 推荐 了 The Tailors Workshop? 因为 它 与 
您 喜欢 的 以 下 艺术 作品 在 主题 上 相似 : * Everyday Life 
* Clothes” 


Moviez plain[ 58] 见 表 15.7 内 容 


MovieLens: “ Tagsplana- D 
doe ter] T | 标签 按照 相关 性 或 者 偏好 排序 内 容 


“这 个 故事 相关 性 分 值 很 高 / 低 ， 因 为 它 包 含 以 下 关键 
i: fl, f2， 和 f3.” 


图 表 从 “更 内 向 "等 维度 比较 两 个 用 户 ， 从 如 何 回答 不 
OkCupid: tore 同 问题 的 方式 比较 用 户 内 容 


“根据 您 以 前 告诉 我 们 的 信息 ， 我 们 推荐 该 物品 因为 它 
有 悠闲 的 节奏 这 个 特征 ……” 










CHIP[20] 





News Dude [12] 
















Pandora. com 





A i Advi 
Ra T Place Advisor | 你 想 去 哪里 吃饭 ?”“ 或 许 去 一 个 便宜 点 的 印度 餐馆 ” 


ACORN(65] “你 喜欢 什么 类 型 的 电影 ?"“ 我 喜欢 惊悚 片 。” 会 话 


“ 它 比 较 适合 小 孩 ， 要 求知 识 背 景 低 ， 需 要 认真 和 迅速 














INTRIGUELS] AANA. ESA AB EA RRM EME.” 人 口 统计 
Quikshopl39] EAF, KARR, EA” 基于 知识 /自然 语言 
Nm m. ， "CR E 
ud. 因为 资料 显示 ， 您 是 单身 ， 有 较 高 的 预算 ” 见 表 | LL ama 
VIN “574 号 物品 与 您 的 请 求 仅 价格 不 同 ， 并 且 无 论 从 交 | ee ae 





通 、 持 续 时 间 还 是 住宿 都 是 您 喜欢 的 最 优 情况 ” 


. “该 解决 方案 被 选中 的 原因 如 下 : 对 该 类 型 的 连接 网 络 
(Internet Provider) [23] 空间 是 可 用 的 ”( 见 表 15. 4) 基于 知识 /自然 语言 


“Organizational Structure” 结构 化 概览 :“ 我 们 推荐 以 下 产品 是 因为 : 他 们 更 便宜 ee 
[49] 且 轻 便 ， 但 是 速度 比较 慢 . 人 


myCameraAdvisor[63 | 





基于 知识 /自然 语言 


在 接 下 来 的 部 分 ， 我 们 将 给 出 更 多 的 例子 讲述 解释 风格 是 如 何 被 像 Burke[13] 分 类 一 
样 的 算法 影响 的 。 对 每 一 个 例子 ， 我 们 还 会 提 及 如 何 展示 推荐 结果 和 选择 交互 模型 。 

为 了 清晰 地 描述 推荐 系统 和 解释 组 件 之 间 的 接口 ， 我 们 使 用 文献 [13] 中 提 到 的 部 分 符 
号 : U 代表 一 组 用 户 的 偏好 ，uEU 代表 需要 被 生成 推荐 结果 的 用 户 。 工 代表 被 推荐 的 物 
品 ，iETI 代 表 我 们 要 预测 用 户 对 该 物品 的 喜好 值 。 


15.7.1 基于 协同 风格 


基于 协同 风格 的 解释 认为 推荐 引擎 的 输入 是 用 户 u 对 物品 I 的 评分 。 这 个 评分 用 来 识 
别 给 工 的 评分 与 w 相似 的 用 户 集合 。 这 些 相 似 的 用 户 经 常 被 称 为 邻居 ， 最 近邻 方法 用 来 计 
算 用 户 之 间 相 似 度 。 这 样 ， 对 推荐 物品 的 预 估 就 推广 为 邻居 对 物品 了 的 评分 。 

商业 上 ， 基 于 协同 风格 解释 的 最 著名 的 应 用 是 亚马逊 网 站 :“ 买 了 此 商品 的 用 户 还 买 
了 ……”。 这 个 解释 的 前 提 是 用 户 正 在 浏览 一 本 他 们 感 兴趣 的 物品 。 它 由 在 找 出 相似 的 用 户 
集合 (这 些 用 户 都 买 过 这 个 物品 )， 并 检索 和 推荐 出 这 些 用 户 买 过 的 其 他 物品 。 推 荐 以 与 最 优 
项 相似 的 形式 展示 。 此 外 ， 解 释 假设 存在 交互 模型 ， 任 借用 户 的 购买 这 种 隐 性 行为 来 评分 。 
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Herlocker 等 提出 了 21 种 使 用 文本 和 图 形 界面 的 解释 界面 [29]。 这 些 界面 的 内 容 和 风 
格 均 不 相同 ， 但 是 大 部 分 解释 都 直接 来 自 邻 居 的 信息 。 以 图 15. 2 为 例 ， 它 显示 了 邻居 如 
何 给 推荐 的 物品 进行 评分 ， 以 “好 ”可 以 ”和 “不 好 ”的 条 状 图 聚 成 不 同 的 列 。 我 们 看 到 这 个 
解释 是 为 特定 的 推荐 物品 和 特定 的 交互 模型 提供 的 : 这 是 单个 推荐 结果 (或 者 是 最 优 项 ， 
或 者 是 最 优 N 项 中 的 一 个 ) ， 并 且 假 设 用 户 提供 了 对 物品 的 评分 。 


15.7.2 基于 内 容 风格 


基于 内 容 风格 的 解释 认为 推荐 引擎 的 输入 是 用 户 u( 子 集 ) 对 物品 了 的 评分 。 这 些 评分 
用 来 生成 一 个 适合 用 户 u 评分 行为 的 分 类 器 ， 再 通过 这 个 分 类 器 发 现 推荐 物品 I。 对 推荐 
结果 的 预 估 在 于 该 结果 对 分 类 器 的 适应 程度 ， 如 它 是 否 与 其 他 高 评分 物品 相似 。 

简单 来 说 ， 基 于 内 容 的 算法 是 基于 物品 的 属性 而 不 是 用 户 的 评分 来 计算 物品 之 间 的 相 
似 度 的 。 同 样 ， 基 于 内 容 风 格 的 解释 也 是 基于 物品 的 属性 产生 的 。 例 如 ，[58jJ 证 明 电 影 推 
荐 结果 是 根据 所 提供 的 用 户 最 喜欢 的 演员 得 到 的 ( 见 表 15. 7) 。 当 底层 算法 是 一 个 基于 协同 
与 基于 内 容 混 合 的 方法 时 ， 解 释 风 格 建议 根据 高 评分 电影 出 现 的 特征 计算 电影 之 间 的 相似 
度 。 他 们 为 当前 用 户 选择 一 些 可 能 更 合适 的 推荐 结果 和 解释 (top-N 项 )， 如 果 用 户 愿意 根 
据 解 释 信息 进行 选择 (例如 ， 感 觉 像 是 看 电影 Harrison Ford 是 因为 Bruce Willis 主演 的 ) 。 
交互 模型 基于 对 物品 的 评分 生成 。 

[62] 提 出 的 一 个 与 领域 无 关 的 方法 是 基于 用 户 指定 的 关键 词 及 标签 计算 物品 之 间 的 相 
似 度 。 在 该 项 研究 中 用 到 的 解释 采用 关键 词语 物品 之 间 的 关系 (标签 相关 性 ) 和 标签 与 用 户 
之 间 的 关系 (标签 属性 ) 进 行 推荐 ( 见 表 15.7) 。 为 一 个 用 户 定义 的 标签 属性 或 者 相关 的 标 
签 ， 可 以 作为 基于 内 容 解释 的 形式 ， 因 为 它 是 通过 该 用 户 给 出 评分 的 电影 集合 包含 的 标签 
进行 加 权 平 均 计算 得 来 的 。 标 签 相关 性 或 相关 的 关键 词 用 于 推荐 物品 ， 即 用 户 标签 属性 和 
他 们 对 电影 喜好 的 相关 性 ， 这 些 电影 也 存在 相关 的 标签 属性 。 在 这 个 例子 中 ， 为 用 户 推荐 
一 个 最 优 项 可 以 允许 用 户 看 到 很 多 相关 标签 结果 。 交 互 模型 是 基于 数值 评分 的 。 


表 15.7  Moviexplain 解释 的 例子 ， 使 用 演员 等 特征 (这 些 特征 
在 该 部 电影 出 来 前 被 用 户 打 了 高 分 ) 来 说 明 推荐 结果 


理由 参与 者 
Willis，Bruce 


Pandora 商业 系统 的 推荐 结果 是 根据 音乐 的 节奏 和 音调 等 属性 计算 得 来 的 。 这 些 特 征 
通过 用 户 对 歌曲 的 评分 生成 。 图 15.6 展 mem 

示 了 这 样 一 个 例子 L1]。 这 里 为 用 户 提供 
了 一 首 歌 曲 ( 最 优 项 )， 用 户 可 以 通过 
“ 顶 ” 和 “ 踊 ” 来 表达 他 们 的 意见 ， 这 些 意 
见 可 以 看 作 数 值 评分 。 


15.7.3 基于 案例 风格 















推荐 电影 名 称 
Indiana Jones and the Last Crusade(1989) 






你 曾 评 了 5 部 电影 
你 曾 评 了 2 部 电影 






Die Hard 2(1990) 





图 15.6 Pandora 的 解释 :“ 基 于 你 之 前 告诉 我 们 的 
解释 也 可 以 忽略 重要 属性 而 聚焦 于 信息 ， 我 们 推荐 这 个 是 因为 它 有 悠闲 的 节 
相似 度 进行 推荐 。 因 此 推荐 物品 被 认为 pes 


是 比较 得 出 的 结果 ， 所 以 解释 是 基于 案例 风格 的 。CBR 系统 与 其 他 系统 对 推荐 算法 的 重 
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视 程 度 是 非常 不 一 样 的 。 例 如 ， 推 荐 结果 “FINDME?[14] 是 基于 评价 得 到 的 ， 排 序 [5] 是 
依据 相似 用 户 对 他 们 旅行 计划 的 描述 。 虽 然 CBR 系统 也 使 用 了 不 同 的 方法 来 展示 他 们 的 


解释 ,但 是 回想 本 节 其 他 部 分 ， 该 节 描 述 M 
的 其 他 解释 风格 重点 在 于 风格 而 不 是 底层 Your prediction is based on how MovieLens 


thinks you like these aspects of the film: 


算法 。 因 此 ， 这 些 系统 理论 上 可 以 有 一 个 


基于 案 例 风 格 的 m E. Mu V NM S bd TOUT 
事实 上 ， 在 本 章 中 我 们 已 经 看 到 了 基 | M deadpan eben 

于 案例 风格 的 解释 。 在 图 15. 5 中 出 现 的 “ 基 Rie 

于 影响 力 风格 的 解释 ”[11]。 推荐 物品 的 影 EE off-beat comedy ook x 

响 力 是 通过 计算 在 有 或 没有 该 物品 的 情况 下 | MESES noble soundiack Kr 





推荐 得 分 的 变化 。 这 种 情况 下 ， 推 荐 将 在 基 
于 交互 的 评分 的 前 提 下 ， 以 最 优 项 的 方式 展 ”图 15.7 通过 标签 属性 和 相关 性 计算 标签 作用 ， 但 
示 。 男 一 项 研究 是 计算 推荐 物品 之 间 的 相似 是 通过 标签 相关 性 进行 排序 

度 ” ， 并 且 在 “基于 实例 ”的 解释 中 将 这 些 相似 物品 为 最 优 项 推荐 的 理由 ( 见 图 15. 8)[30] 。 


15.7.4 基于 知识 /自然 语言 风格 


基于 知识 和 自然 语言 风格 的 解释 认为 推荐 引擎 的 输入 是 对 用 户 U 的 需求 或 者 兴趣 的 描述 
信息 。 推 荐 引擎 推断 物品 ; 与 用 户 U 的 需求 之 间 的 匹配 程度 。 一 个 基于 知识 的 推荐 系统 考虑 
如 何 用 相机 的 属性 (如 内 存 、 分 辨 率 和 价格 ) 反 映 可 用 属性 及 用 户 偏好 L39]。 他 们 的 系统 可 能 
用 以 下 方式 解释 相机 的 推荐 :“ 更 少 的 内 存 、 更 低 的 分 辨 率 、 更 便宜 。” 这 里 的 推荐 结果 通过 
结构 化 描述 展示 它 的 竞争 性 ， 并 且 交 互 模型 可 以 使 用 户 改 变 他 们 对 推荐 物品 的 要 求 。 

相 类 似 ， 在 系统 描述 [43] 中 用 户 逐 渐 制 订 ( 或 修改 ) 他 们 的 偏好 直到 推荐 出 最 满意 的 结 
果 。 这 个 系统 可 以 为 推荐 结果 “Case 574” 生 成 如 下 的 解释 :“ 最 优选 项 : Case 574 与 您 的 查询 
条 件 仅 在 价格 上 不 同 ， 并且 无 论 是 交通 、 We recommend: "The Cars" 
时 间 还 是 你 喜欢 的 类 型 都 是 最 好 的 结果 ”一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 

知识 之 间 存 在 一 定 程度 的 重症， 基于 Your Predicted Rating: X 9 x 
内 容 风 格 ( 见 15. 7. 2 节 ) 和 基于 案例 风格 
( 见 15. 7. 3 节 ) 可 以 由 任意 类 型 的 算法 实 
现 细 节 得 到 。 


15.7.5 基于 人 口 统计 风格 


基于 人 口 统计 学 的 解释 ， 认 为 推荐 引 
擎 的 输入 是 对 用 户 U 的 人 口 统计 信息 。 基 +Liked this artit ^ —Didn’t like this artist 
于 此 ， 推 荐 算法 会 识别 在 人 口 分 布 上 与 U 图 15.8 通过 例子 学 习 ， 或 者 通过 案例 的 推理 [30] 
相似 的 用 户 集合 。 对 推荐 物品 工 的 预测 值 
源 于 相似 用 户 集合 对 了 的 评分 和 这 些 用 户 与 U 的 相似 程度 。 

测试 大 量 的 基于 人 口 统计 过 滤 的 系统 如 [6，34，48]， 我 们 只 发 现存 在 一 个 解释 群 : 
“对 孩子 是 有 吸引 力 的 ， 它 对 知识 背景 要 求 低 ， 它 需要 认真 且 快 速 浏览 。 对 您 来 说 它 是 有 


Your ratings for similar arlists 


“Fun For All’ 

' Atari Teeage Itiel’ 
‘Racers’ 

“Death Cali’ 

“Rise Againsl' 
‘Funay Boys’ 
‘The Big Band’ 


+ 


1 + 二 十 十 十 


加 ”作者 并 没有 指定 采用 了 哪 种 相似 度 标准 ， 尽 管 可 能 是 一 种 基于 评分 的 相似 度 衡量 方法 ， 如 余弦 相似 度 。 
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吸引 力 的 并 且 它 有 很 高 的 历史 价值 。 对 残障 人 士 来 说 更 有 吸引 力 和 历史 价值 L6]。 在 这 个 
推荐 系统 中 提供 了 结构 化 的 概览 ， 根 据 它们 的 适用 性 向 不 同 的 旅游 者 分 类 展示 (如 小 孩 、 
残障 人 士 )。 用 户 可 以 添加 这 些 ， 并 将 这 些 结果 加 入 他 们 的 旅行 日 程 ， 但 是 没有 交互 模型 
来 修改 以 后 的 推荐 结果 。 

据 我 们 所 知 ， 没 有 其 他 系统 用 人 口 统计 风格 的 解释 。 可 能 是 因为 人 口 信息 的 敏感 性 ; 
有 趣 的 是 ， 我 们 可 以 想象 很 多 用 户 不 希望 根据 他 们 的 性 别 、 年 龄 或 者 种 族 来 进行 推荐 (如 
“我 们 为 您 推荐 电影 “Sex in the City "是 因为 您 是 一 位 20~40 岁 的 女性 ”) 。 


15.8 总 结 与 展望 


在 这 一 章 ， 我 们 为 推荐 系统 解释 设计 者 提供 了 设计 指南 。 首 先 ， 设 计 者 应 该 考虑 解释 
带 来 的 好 处 ， 正 是 如 此 要 评估 解释 的 指标 (如 透明 度 、 可 读 性 、 可 信和 度 、 有 效 性 、 说 服 力 
和 满意 度 ) 。 开 发 人 员 可 以 选择 彼此 相关 的 多 个 标准 ， 也 可 以 选择 相互 互 斥 的 多 个 标准 。 
如 果 选 择 的 标准 互 斥 ， 区 分 评估 标准 就 特别 重要 。 在 最 近 的 研究 中 这 种 权衡 体现 了 出 来 ， 
且 变 得 越 来 越 明显 [20，61]。 

此 外 ， 当 评估 解释 时 ， 系 统 设计 者 应 该 考虑 他 们 要 选择 的 指标 ， 解 释 的 依赖 关系 可 能 
与 系统 各 模块 的 依赖 关系 不 同 ， 如 推荐 被 展示 的 方式 (如 最 优 物品 、 最 优 N 物品 、 最 优 项 
相似 物品 、 为 所 有 物品 预测 并 评分 、 结 构 概 览 )， 用 户 与 解释 交互 的 方式 (例如 ， 用 户 指定 
他 们 的 需求 ， 要 求 变 更 ， 给 物品 评分 ， 提 供 他 们 的 参考 意见 或 者 使 用 一 个 混合 交互 界面 ) 
和 底层 推荐 引擎 。 

如 果 要 提供 一 个 简单 的 例子 来 说 明 解 释 与 其 他 推荐 系统 因素 之 间 的 关系 ， 我 们 就 可 以 
想象 一 个 准确 度 较 低 的 推荐 引擎 。 当 用 户 不 喜欢 最 终 推荐 给 他 们 的 物品 时 ， 这 可 能 会 影响 
系统 中 有 效 性 的 所 有 计算 。 然 而 ， 这 些 计 算 不 会 反映 解释 本 身 的 有 效 性 。 这 种 情况 下 ， 需 
要 采用 分 层 的 评估 方法 [47]j， 解 释 与 推荐 算法 是 相互 独立 的 [61]。 同 样 ， 应 该 考虑 展示 推 
荐 结果 的 方法 ， 交 互 的 方法 可 能 会 影响 解释 的 评估 。 

我 们 提供 了 一 些 例 子 讲解 受 常见 算法 影响 的 解释 风格 (如 基于 内 容 、 协 同 、 人 口 统计 、 
基于 知识 /自然 语言 ) 以 及 他 们 在 现 有 系统 中 的 应 用 。 从 某 种 程度 上 来 说 ， 不 同 的 解释 风格 
可 以 混合 使 用 (这 样 会 牺牲 透明 度 ) ， 并 用 于 复杂 的 推荐 方法 ， 如 潜在 语义 分 析 ， 但 这 些 领 
域 的 研究 有 竺 展开。 这 些 领域 中 初步 可 以 做 的 一 些 工 作 可 以 在 文献 [33] (解释 马尔 可 夫 决 
策 过 程 ) 和 [31] (解释 潜 在 语义 分 析 ) 中 找到 。 

然而 ， 人 们 还 没有 对 解释 风格 与 它们 在 解释 目的 上 的 效果 进行 比较 。 这 是 一 个 研究 
方向 ， 我 们 希望 在 不 久 的 将 来 能 有 进一步 的 成 果 。 同 样 ， 将 来 的 工作 可 能 会 涉及 更 高 级 
的 界面 。 例 如 ， 树 状 结构 ( 见 图 15. 9[4]) 为 我 们 提供 一 个 搜索 空间 的 概览 [9]。 这 种 概 
览 的 风格 也 可 用 于 解释 。 例如， 一 个 用 户 被 推荐 了 文章 “The Votes Obama Truly 
Needs”， 而 该 文章 正 是 在 这 个 概览 中 凸显 出 来 的 内 容 。 界 面 “解释 ”这 篇 文章 被 推荐 的 原 
因 是 这 个 用 户 近 期 比较 关注 美国 新 闻 ( 桥 黄色 )， 而 它 是 热门 的 新 闻 ( 面 积 大 )， 且 是 比较 
新 的 (明亮 的 颜色 ) 。 

最 后 ， 研 究 员 开始 发 现 解释 是 循环 过 程 的 一 部 分 。 解 释 会 影响 用 户 对 推荐 系统 的 想 

法 ， 反 过 来 又 作用 于 解释 的 界面 上 。 事 实 上 ， 这 也 可 能 影响 推荐 的 准确 性 [7，20]。 例 如 ， 
文献 [7] 发 现 用 户 在 新 闻 推荐 系统 里 从 自己 的 个 人 信息 里 删除 关键 字 ， 会 导致 推荐 精度 下 
降 。 理 解 这 种 循环 周期 可 能 会 成 为 将 来 研究 的 方向 之 一 。 


B] 15.9 新 闻 地 图 一 一 一 个 可 视 化 新 闻 树 。 不 同 的 颜色 代表 主要 区 域 ， 面 积 和 字体 大 小 
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基于 实例 评价 研究 的 产品 推荐 系统 的 可 用 性 准则 





Pearl Pu, Boi Faltings, Li Chen, Jiyong Zhang 和 Paolo Viappianni 


dx ”在 过 去 的 十 年 中 ， 我 们 团队 开发 了 一 套 基 于 实例 评价 的 决策 工具 ， 来 帮助 用 户 
在 电子 购物 中 发 现 自己 更 喜欢 的 产品 。 在 本 章 中 ， 我 们 将 调研 实例 评价 相关 的 可 用 性 研究 
工作 ， 并 衍生 出 一 套 可 用 性 指导 准则 ， 来 总 结 这 方面 的 主要 结果 。 我 们 的 调研 侧重 于 用 户 
与 系统 的 三 个 关键 交互 过 程 : 初始 偏好 提取 过 程 、 偏 好 修正 过 程 、 推 荐 系统 结果 的 展示 过 
程 。 为 了 对 这 些 准则 的 推导 提供 基础 ， 我 们 根据 三 个 交互 参数 : 准确 性 、 信 任 度 、 代 价 
(Accuracy Confidence Effort，ACE) ， 开 发 了 一 个 多 目标 框架 。 我 们 采用 这 个 框架 分 析 了 
过 去 的 工作 ， 并 对 每 个 准则 给 出 了 特定 的 应 用 环境 : 什么 时 候 系统 应 最 大 化 地 增加 用 户 的 
决策 精度 ， 什 么 时 候 提 高 用 户 信任 度 ， 什 么 时 候 应 最 小 化 与 用 户 交 互 的 代价 。 由 于 这 一 多 
准则 模型 的 通用 特性 ， 我 们 提出 的 这 些 准 则 ， 将 有 助 于 其 他 推荐 系统 ， 特 别 是 电 商 环境 中 
的 可 用 性 设计 过 程 。 我 们 在 这 一 领域 首创 的 ACE 框架 ， 同 样 也 适用 于 评估 基于 用 户 兴趣 
推荐 系统 的 效果 。 这 里 提出 的 ACE 框架 也 是 这 一 领域 首次 从 用 户 中 心 的 视角 评估 基于 偏 
好 推荐 系统 效果 的 方法 。 

因此 ， 开 发 者 可 以 通过 这 些 准则 ， 开 发 出 效果 更 好 、 更 成 功 的 产品 推荐 系统 。 


16.1 简介 


著名 的 可 用 性 研究 者 Jacob Nielsen 曾 提 出 : 电 商 的 第 一 定律 是 ， 如 果 用 户 不 能 发 现 
一 个 产品 ， 那 么 他 们 就 不 可 能 会 买 它 ” 。 这 里 的 “发 现 ” 实 际 上 是 为 电子 商务 系统 所 必须 满 
足 的 挑战 性 任务 做 了 一 个 定义 。 它 指 的 是 在 线 零售 商 帮 助 用 户 找到 满意 产品 (有 时 甚至 自 
己 不 知道 )， 并 鼓励 用 户 购买 推荐 产品 的 能 力 。 也 就 是 说 ， 系 统 不 仅 需 要 帮助 用 户 寻 找 ， 
而 且 需 要 辅助 其 做 出 购买 决定 。 

当 用 户 在 网 上 环境 中 碰 到 上 述 问题 时 ， 他 们 究竟 会 怎么 做 呢 ? 随 着 愈演愈烈 的 竞争 ， 
在 线 零 售 商 必 须 维护 一 个 逐渐 增多 的 有 效 产品 集 。 新 的 物品 会 定期 添加 到 库存 目录 中 ， 来 
保证 直接 竞争 者 的 产品 也 在 他 们 自己 的 库存 中 。 查 找 想 要 的 选择 这 一 任务 直接 依赖 于 可 供 
选项 的 数量 。 事 实 上 随 着 无 限 货物 仓库 这 一 概念 的 推广 ， 对 一 般 用 户 而 言 ， 这 一 任务 即使 
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不 是 不 可 能 ， 也 将 变 得 更 加 艰巨 。 在 这 种 情况 下 ， 用 户 倾 向 于 使 用 以 下 两 种 决策 方法 中 之 
一 。 第 一 种 情况 ， 他 们 试图 得 到 更 高 的 决策 准确 率 ， 但 却 需要 筛选 所 有 选项 ， 并 在 产品 各 


”个 方面 优 缺 点 之 间 权衡 上 耗费 大 量 时 间 。 另 一 方面 ， 他 们 也 可 以 采用 启发 式 的 策略 ， 更 有 


选择 性 地 处 理 信息 。 这 种 情况 下 ， 尽 管 他 们 花费 了 更 少 的 工作 ， 这 些 启 发 式 策略 也 可 能 导 
致 决策 失误 甚至 后 悔 。 总 而 言 之 ， 在 准确 率 和 代价 平衡 关系 上 ， 没 有 哪 种 方法 是 理想 最 优 
的 。 参 考 [40]， 如 何在 决策 中 把 握 好 准确 率 和 代价 的 平衡 ， 是 个 不 好 调解 的 工作 。 

有 些 知 名 的 研究 工作 ， 提 出 了 如 何 为 用 户 开发 交互 高 效 和 智能 的 工具 。 因 此 ， 基 于 偏 
好 的 推荐 系统 出 现 了 ， 其 有 效 的 搜索 和 导航 机 制 ， 在 电子 商务 及 其 他 决策 环境 中 ， 得 到 广 
泛 认 可 。 在 过 去 的 十 年 中 ， 我 们 提出 了 实例 评价 的 方法 ， 开 发 了 一 套 基于 该 方法 的 决策 工 
具 ， 为 产品 搜索 问题 [43，45，51，52] 提 供 个 性 化 和 推荐 。 目 前 已 经 开展 并 发 表 了 十 多 项 
用 户 调查 研究 ， 在 出 行 计 划 、 公 寓 搜 索 、 数 码 产品 的 检索 等 领域 验证 了 该 方法 。 但 是 ， 在 
电子 商务 领域 得 到 广泛 应 用 的 实例 评价 方法 仍然 存在 一 定 的 局 限 性 。 

我 们 的 目标 是 通过 分 析 和 调查 我 们 之 前 实例 评价 方向 上 的 工作 ， 通 过 总 结 出 一 套 可 用 
性 准则 ， 综 合 了 主要 成 果 。 更 特别 的 是 ， 我 们 主要 关注 初始 偏好 提取 过 程 、 偏 好 修正 过 
程 、 推 荐 系统 结果 的 展示 过 程 这 三 个 关键 交互 过 程 。 为 了 对 准则 的 导出 提供 基准 ， 我 们 调 
研 了 一 个 产品 推荐 系统 为 了 最 大 化 满足 用 户 需求 以 及 使 用 推荐 系统 意愿 所 必须 满足 的 目 
标 。 推 荐 系统 的 准确 率 ， 也 就 是 系统 如 何 找到 用 户 真 正 想 要 的 物品 ， 通 常 是 推荐 系统 的 一 
个 重要 的 中 心 内 容 。 但 是 ， 准 确 率 并 没有 完全 考虑 用 户 的 利益 ， 因 为 准确 率 的 提高 有 可 能 
是 通过 牺牲 系统 的 可 用 性 达到 的 [35]。 我 们 都 知道 ， 当 人 们 认 知 能 力 有 限时 ， 用 户 很 难得 
到 高 精度 的 准确 率 ， 因 为 这 需要 的 代价 是 更 高 的 。 由 于 产品 检索 是 个 决策 过 程 ， 推 荐 系统 
必须 让 用 户 相 信 系 统 推荐 给 他 的 一 定 是 自己 真正 想 要 的 (信任 度 )。 因 此 ， 不 仅 包括 准确 
率 ， 我 们 提出 了 称 为 ACE 的 多 目标 框架 ， 得 到 了 可 用 性 准则 : 1) 系 统 帮 助 用 户 发 现 最 高 
欢 物 品 的 能 力 (Accuracy， 准 确 率 ); 2) 系 统 激发 用 户 有 信心 选择 推荐 给 他 们 的 物品 的 能 力 
(Confidence， 信 任 度 ); 3) 实 现 相应 准确 率 用 户 所 需 的 总 代价 (Effort， 用 户 代价 )。 

考虑 这 样 一 种 情况 ， 部 分 用 户 愿 意 花 费 大 量 的 时 间 来 获得 非常 准确 的 推荐 结果 ， 而 部 
分 用 户 可 能 愿意 接受 低 准 确 率 但 是 快速 的 结果 ， 因 此 ， 推 荐 系统 的 设计 者 必须 权衡 好 准确 
率 和 代价 ， 这 也 是 权衡 信任 度 和 代价 的 过 程 ， 因 为 用 户 如 果 更 相信 推荐 结果 ， 则 其 可 能 更 
愿意 接受 更 多 的 交互 代价 。 可 见 ， 推 荐 系统 设计 的 最 大 挑战 是 如 何 让 用 户 坚信 ， 只 要 他 们 
花费 足够 的 代价 ， 就 能 获得 可 接受 的 推荐 结果 。 

得 到 这 些 准则 的 这 三 个 条 件 同样 也 可 以 作为 评估 框架 来 衡量 一 个 产品 推荐 系统 的 可 用 
性 。 因 此 本 章 在 推荐 系统 的 两 个 主要 方面 作出 了 贡献 。 从 学 术 角 度 看 ， 本 章 提出 了 一 套 以 
用 户 为 中 心 的 标准 ， 来 评估 基于 偏好 推荐 系统 的 效果 。 从 实践 角度 看 ， 本 章 在 三 种 关键 交 
互 行为 上 调研 了 实例 评价 的 现状 ， 得 出 11 个 更 具 推广 型 和 可 扩展 性 的 可 用 性 准则 。 由 于 
这 些 准则 源 自 的 方法 已 经 在 可 用 性 研究 中 得 到 了 验证 ， 所 以 实际 开发 者 可 以 在 产品 推荐 系 
统 ( 包 括 设计 阶段 和 测试 阶段 ) 的 可 用 性 设计 过 程 中 大 胆 采 用 。 


16.2 预备 知识 
16.2.1 交互 模型 


基于 用 户 偏好 的 推荐 系统 ， 是 根据 用 户 对 于 物品 属性 偏好 的 显 式 表述 来 向 用 户 推 荐 物 
品 的 。 虽 然 本 章 描述 的 推荐 系统 是 使 用 不 同 的 体系 结构 以 及 使 用 不 同 的 数据 集 来 进行 评估 
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的 ， 但 是 ， 特 别 是 在 交互 模型 上 ， 它 们 都 有 一 些 共同 的 特征 。 为 了 梳理 贯穿 整个 调研 所 用 
到 的 术语 和 准则 推导 过 程 ， 我 们 在 图 16. 1 中 给 出 了 能 概括 推荐 系统 各 个 阶段 的 交互 通用 
模型 。 用 户 会 通过 像 图 形 用 户 界 面 这 样 的 形式 来 设置 一 组 初始 偏好 开始 交互 过 程 。 然 后 ， 
推荐 系统 根据 采集 到 的 用 户 信息 ， 过 滤 掉 无 效 选择 ， 然 后 根据 用 户 偏好 ， 给 用 户 返 回 推荐 
的 结果 (Recommendation Set， 推 荐 集合 ) 。 接 着 ， 有 两 种 情况 ， 要 么 用 户 从 推荐 集合 中 找 
到 最 喜欢 的 物品 ， 结 束 与 系统 的 交互 ， 要 么 用 户 修改 偏好 模型 以 获得 更 精确 的 推荐 ， 如 使 
用 类 似 “ 我 想 要 更 便宜 的 物品 ”的 评价 。 最 后 的 用 户 反 馈 步骤 称 为 偏好 修正 。 最 终 ， 用 户 或 
者 选择 了 单个 物品 ， 或 者 构建 了 一 个 可 用 于 进一步 比较 的 考虑 集合 。 


SRL: 用 户 指定 初始 偏好 w 所 有 选择 的 空间 
Wwe 


步骤 2: 产品 搜索 工具 基于 









A 用 户 状态 的 偏好 过 滤 选 项 
并 展示 推荐 物品 
被 选中 为 推荐 集合 
K 个 最 合适 的 物品 
A ee 
PR: 最 终 选择 


得 到 更 多 的 
推荐 修正 偏好 


— 3 


图 16.1 典型 的 用 户 系 统 交 互 过 程 


当然 ， 如 果 用 户 对 这 一 过 程 确实 能 找到 满意 的 产品 不 抱 有 足够 的 信心 ， 而 且 因此 不 愿 
完成 充分 的 偏好 修正 循环 让 系统 产生 精确 的 偏好 模型 ， 这 样 推荐 系统 就 可 能 失败 了 。 我 们 
的 指导 准则 可 以 避免 这 种 情况 ， 本 章 最 后 将 提供 一 个 模型 ， 根 据 用 户 的 决策 过 程 ， 对 该 模 
型 进行 基本 阐释 。 

推荐 集合 生成 后 ， 系 统 可 以 采取 多 样 的 策略 来 展示 这 些 结果 。 一 个 典型 的 展示 方法 就 
是 ， 在 疡 个 交互 过 程 中 ， 每 个 过 程 展示 RAOK, n 是 产品 总 数 ) 个 物品 。 在 每 次 展现 这 
k 个 物品 时 ， 用 户 都 会 挑 出 她 的 目标 结果 加 入 考虑 集合 中 。 当 然 ， 过 程 越 多 ， 用 户 需要 花 
费 的 代价 也 就 越 多 。 另 一 方面 ， 如 果 展 示 的 集合 较 少 ， 用 户 可 以 整体 浏览 一 遍 来 得 到 目标 
结果 ， 进 而 参与 更 多 的 交互 过 程 。 这 个 代价 和 准确 率 的 权衡 问题 ， 在 个 性 化 推荐 系统 中 会 
被 详细 讨论 到 。 

上 面 提 到 的 各 种 交互 过 程 可 能 不 会 同时 出 现在 相同 的 系统 里 。 例 如 ， 初 始 偏 好 提取 过 
程 可 以 是 一 个 可 选 的 步骤 ， 用 户 一 访问 站 点 就 被 提供 一 组 推荐 结果 (如 各 个 类 目下 的 畅销 
品 )。 男 一 方面 ， 其 他 系统 可 能 会 提取 用 户 的 初始 偏好 ， 但 不 提供 选项 允许 用 户 修改 它们 。 


16. 2.2 基于 效用 的 推荐 系统 


由 于 实例 评价 工具 是 基于 多 重 属性 效用 理论 的 ， 我 们 将 给 出 这 一 基础 推荐 算法 的 综述 。 
这 类 推荐 系统 的 潜在 的 基本 假设 是 ， 人 们 因为 物品 的 某 些 属性 从 而 对 该 物品 有 偏好 。 
一 个 属性 的 不 同 数值 对 应 着 不 同 的 偏好 程度 ， 如 当 客 人 很 多 时 ， 大 型 的 公寓 会 很 有 用 ， 可 
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是 当 需 要 打扫 时 ， 这 就 成 为 了 缺点 。 因 此 ， 用 户 需 要 根据 物品 每 项 特点 有 用 或 无 用 的 程度 
来 权衡 其 优点 和 缺点 ， 即 偏好 是 属性 的 加 权 函 数 。 
形式 上 ， 基 于 偏好 的 推荐 问题 可 以 描述 为 多 重 属 性 决策 问题 (Multi-Attribute Decision 


Problem, MADP): W=(X, D, O, P», Hip X={X,, c, X OHEA d ia rS 
ft» D=D, X- XD, 指 产品 在 每 项 属性 上 的 值 域 (X; 对 应 的 值 域 为 D; 1<i<n)), O= 
(0 ，…，O-.}， 指 当前 库存 物品 集合 ，P={P, ，…，P.,} 为 用 户 的 偏好 集 。MADP 的 目 


标 是 找到 一 种 用 户 最 感 兴趣 的 产品 ， 该 类 问题 可 以 使 用 基于 约束 方法 和 基于 效用 的 方法 来 
处 理 。 接 下 来 我 们 将 引出 基于 多 属性 效用 理论 (MAUT) 的 方法 来 解决 一 个 给 定 的 MADP 
问题 ， 基 于 限制 的 方法 请 参考 文献 L45] 。 
16.2.2.1 多 属性 效用 理论 (MAUT) 

效用 理论 要 追溯 到 1738 年 ， 当 时 Bernoulli 从 货币 价值 效用 的 角度 提出 了 他 对 于 
St. Petersburg 悖 论 的 阐释 。 两 个 世纪 之 后 ，von Neumann 和 Morgenstern 重新 使 用 此 方 
法 来 解决 他 们 在 经 济 学 中 遇 到 的 问题 [71]。 后 来 ，20 世纪 50 年 代 ，Marschak[29]、Her- 
stein 和 Milnor[21]， 以 形成 Von Neumann Morgenstern 定理 (VNM 定理 )L39，59] 根 基 
的 一 套 公理 为 基础 ， 建 立 了 期 望 效用 理论 。 

20 世纪 70 年 代 ，Kneeney 和 Raiffa[24] 扩 展 了 效用 理论 ， 能 够 支持 多 属性 的 情况 。 
多 属性 效用 理论 的 主要 思想 是 将 用 户 偏好 表示 为 属性 值 的 效用 函数 。 

使 用 符号 二 表示 用 户 偏 好 顺序 ， 如 ALB 表示 用 户 对 A 的 偏好 程度 高 于 B。 根 据 效 用 
理论 ， 对 于 一 个 给 定 的 MADP 问题 ， 存 在 一 个 效用 函数 U: O->%， 对 于 任意 产品 集合 O 
中 的 产品 O 和 OEO， 存 在 以 下 等 价 关系 : 


O > OSU(O) > U(O) (16. 1) 

FHA, 产品 O 表示 为 一 系列 属性 的 集合 (Xi Hn, cs. X= r) WBA, os 
Xs))， 因 此 上 述 公 式 等 价 于 : 

Gn (mn) > (Tist Ey SU Cry 9 288 9 Zn) DUCT Tn) (16. 2) 


可 见 ， 如 果 给 出 了 效用 函数 ， 那 么 根据 上 述 公 式 ， 任 意 的 产品 的 偏好 度 都 可 以 用 数值 效 
用 表示 ， 也 能 对 所 有 产品 根据 偏好 排序 。 
因此 ， 找 出 能 够 准确 表示 用 户 偏好 的 效用 函数 U， 是 一 项 很 有 挑战 性 的 工作 。 虽 然 理 
论 上 效用 函数 可 以 用 任何 形式 表示 用 户 偏好 ， 但 是 经 常 使 用 其 中 一 种 来 减少 计算 代价 。 如 
果 各 个 偏好 都 是 相互 独立 的 9? ， 那 么 效用 函数 具有 如 下 的 附加 形式 : 


UC x, m) = 2 wi) (16. 3) 


KB. v 是 属性 X, 上 的 值 函 数 (范围 是 [0，1])，w; 是 属性 X, 的 权重 ， Y 一 1， 


也 就 是 说 产品 O 的 效用 函数 是 所 有 属性 值 的 权重 的 总 和 。 每 项 属性 的 权重 ， 缺 省 值 可 以 是 
1/n， 可 以 允许 用 户 设 置 多 项 属性 上 的 权重 。 值 函数 vi 则 由 用 户 对 属性 X; 的 偏好 决定 。 
通常 具有 形式 为 v; — az; +b 的 线性 函数 足以 用 来 表示 用 户 在 每 一 个 属性 上 的 偏好 。 

一 旦 每 项 物品 的 效用 函数 都 确定 了 ， 我 们 可 以 根据 效用 值 对 产品 进行 排序 ， 并 选 出 前 
K 项 最 高 的 物品 作为 推荐 集合 。 在 实践 中 ， 我 们 假定 任 一 产品 的 各 项 属性 都 是 独立 的 ， 因 


O ”如果 属性 X 的 值 不 依赖 于 属性 Y， 则 称 X für T Y, NES ims S 则 称 X 5 Y 相互 独 
立 , 文献 [22] 有 更 多 具体 细节 。 
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此 也 可 以 使 用 上 述 的 效用 函数 的 附加 形式 。 
16.2.3 准确 率 、 信 任 度 和 代价 的 框架 


在 引言 中 提 到 ， 我 们 关于 多 目标 需求 框架 的 研究 ， 是 为 了 探寻 如 何 演化 设计 指导 原则 
的 基本 原理 。 我 们 寻找 产品 推荐 系统 必须 满足 的 标准 ， 来 实现 最 大 满足 用 户 需 求 和 最 大 提 
高 用 户 使 用 系统 的 意愿 。 因 此 ， 我 们 不 仅 给 出 了 ACE(Accuracy、Confidence、Effort) 框 
架 更 精确 的 定义 ， 也 给 出 了 衡量 这 三 个 变量 的 方法 。 

准确 率 是 指 推荐 系统 的 客观 准确 率 。 对 于 基于 评分 的 系统 (Rating-based Systems), 
最 常用 的 衡量 方法 是 平均 绝对 偏差 (Mean Absolute Error，MAE)[1]。 它 是 通过 对 数据 集 
的 离线 的 计算 步骤 来 衡量 的 ， 也 就 是 俗称 “ 留 一 法 ”(leave-one-out)。“ 留 一 法 ”通过 先 去 除 
一 个 评分 ， 用 被 评估 的 推荐 系统 算法 预测 这 一 评分 。 这 一 估算 评分 将 会 与 实际 评分 进行 对 
比 ， 并 计算 两 者 的 绝对 偏差 值 。 重 复 将 这 一 步骤 用 于 所 有 的 评分 然后 计算 出 的 平均 值 称 
为 平均 绝对 偏差 。 ， 

基于 效用 的 推荐 系统 产生 的 推荐 结果 ， 是 基于 用 户 偏好 数据 的 ， 而 这 些 数据 是 不 可 能 
被 模拟 出 的 ， 因 此 ， 离 线 的 衡量 准确 率 的 方法 也 是 行 不 通 的 。 这 一 领域 ， 常 用 的 一 个 方法 
是 文献 L48] 定 义 的 任务 更 换 (switching task) 。 它 通常 可 以 估量 出 用 户 偏好 物品 有 多 少 是 出 
自 系统 的 推荐 结果 。 例 如 ， 如 果 在 实验 操作 者 给 出 所 有 的 可 能 选项 之 后 ， 有 70% 的 用 户 没 
有 改变 他 们 的 决定 ， 认 为 在 推荐 过 程 中 发 现 了 他 们 偏好 的 物品 ， 则 系统 的 推荐 率 是 70%。 
因此 ， 实 验 第 一 步 ， 每 个 用 户 需 要 与 推荐 系统 交互 以 选 出 考虑 集合 。 第 二 步 ， 实 验 操作 者 
需要 展示 所 有 存在 的 物品 ， 然 后 用 户 判 定 考虑 集合 中 所 有 物品 是 否 仍 有 吸引 力 。 如 果 他 更 
换 了 其 他 的 物品 ， 则 系统 未 能 帮助 他 做 出 准确 的 决策 。 类 似 于 这 样 的 过 程 ， 在 消费 者 决策 
中 被 用 于 评判 决策 质量 ， 称 为 任务 更 换 [20]。 更 换 物 品 的 用 户 比 例 ， 称 为 更 换 率 ， 它 是 唯 
一 能 够 计算 出 个 性 化 推荐 工具 的 决策 准确 率 的 精度 的 方法 。 可 是 ， 由 于 这 个 方法 是 很 耗 时 
的 ， 任 务 更 换 方 法 仅 用 于 精心 定义 的 实验 研究 中 。 

用 户 信任 度 是 ACE 框架 的 第 二 个 评估 准则 ， 说 明了 系统 诱导 用 户 选 择 推荐 结果 的 能 
力 。 这 是 一 个 主观 变量 ， 只 能 通过 研究 后 期 的 调查 问卷 得 到 ， 让 用 户 给 出 满意 度 描述 ， 如 
我 相信 系统 推荐 给 我 的 正 是 我 想 要 的 。 由 于 客观 准确 率 很 难得 到 ， 用 户 的 信任 度 常常 用 于 
评估 系统 的 感知 准确 率 。 感 知 准确 率 ， 与 实际 的 准确 率 有 很 强 的 相关 性 ， 但 同样 也 会 被 系 
统 的 其 他 因素 所 影响 : 用 户 是 否 被 给 予 了 足够 的 选择 并 被 充分 地 包含 在 偏好 诱导 和 修正 过 
程 中 ， 推 荐 结果 的 展现 形式 是 否 让 用 户 确信 已 经 发 现 最 好 的 结果 。 

用 户 代 价 包 含 了 两 个 时 间 花 费 ， 第 一 个 是 用 于 完成 引导 行为 ， 如 偏好 提取 和 偏好 修正 
的 所 需 时 间 ， 第 二 个 是 用 户 构 造 考虑 集合 所 需 时 间 。 我 们 也 可 以 为 任意 交互 行为 衡量 交互 
周期 的 次 数 来 蔡 换 花费 的 时 间 ， 这 样 度量 就 与 单个 用 户 的 活动 习惯 就 无 关 了 。 

本 章 分 析 了 基于 实例 推荐 系统 三 个 主要 步骤 : 偏好 提取 、 偏 好 修正 和 结果 展示 ， 然 后 
使 用 准确 率 、 信 任 度 和 代价 来 评估 不 同 的 推荐 技术 ， 然 后 衍生 出 11 条 成 功 的 基于 实例 推 
荐 系统 中 的 指导 准则 ， 最 后 与 提供 统一 动机 的 用 户 行为 模型 进行 对 比 。 

我 们 相信 ， 用 户 信 任 度 是 评判 任何 推荐 系统 效果 的 主要 因素 ， 因 此 我 们 认为 ACE 框 
架 同 样 适用 于 评判 其 他 类 型 的 推荐 系统 。 


16.2.4 本 章 结 构 
我 们 根据 图 16. 1 描述 的 三 个 过 程 : 偏好 提取 (第 一 步 冯 偏好 修正 (第 四 步 )、 展 示 策 
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略 (第 二 步 )， 对 上 述 11 条 指导 原则 进行 分 类 。 接 下 来 的 章节 包括 : 16.3 节 回 顾 了 其 他 领 
域 中 ， 偏 好 提取 过 程 和 个 性 化 推荐 工具 的 设计 准则 。16. 4 节 介 绍 了 激发 用 户 尽 可 能 准确 
地 描述 其 初始 偏好 的 准则 。16. 5 节 继 续 讨 论 偏好 提取 和 标识 出 具体 方法 ， 来 帮助 用 户 描 
述 出 其 完整 的 喜好 。16. 6 节 阐 述 了 帮助 用 户 解 决 偏好 冲突 和 决策 权衡 的 策略 。16. 7 节 提 
出 了 展示 策略 的 一 些 准 则 ， 以 便 能 够 实现 较 低 的 用 户 交互 代价 ， 较 高 的 决策 精度 和 信任 
度 。16. 8 节 提 出 的 用 户 行为 模型 对 这 些 准 则 给 出 了 理论 依据 。16. 9 节 总 结 全 文 。 


16.3 相关 工作 
16. 3. 1 推荐 系统 分 类 


有 两 类 推荐 系统 已 经 广为人知 ， 并 且 广 泛 用 于 收集 和 构建 用 户 偏好 数据 集 。 一 类 是 基 
于 用 户 显 性 描述 偏好 的 推荐 系统 (Preference-based Recommender), 5 —25 EET HP 8 
航 和 购买 行为 的 推荐 系统 (Behavior-based Recommender) 。 基 于 行为 的 推荐 系统 生成 推荐 
结果 时 会 根据 用 户 累 积 的 交互 行为 ， 如 用 户 浏览 和 购买 过 的 物品 ， 请 参考 文献 L75] 对 它 的 
论述 ， 并 参考 [26，55] 对 基于 人 口 统计 的 推荐 系统 的 论述 。 基 于 偏好 的 推荐 系统 又 包含 四 
种 类 型 : 基于 评分 的 ， 基 于 案例 的 ， 基 于 效用 的 和 基于 评价 的 。 更 多 推荐 系统 的 分 类 方法 
请 参考 [1，7] 。 


16.3.2 基于 评分 的 推荐 系统 


用 户 通过 对 他 们 接触 过 的 物品 给 出 二 元 或 多 尺度 分 数 的 方式 ， 显 式 地 表达 他 们 的 偏好 
(甚至 他 们 自己 都 不 知道 )。 要 么 是 系统 向 用 户 提 供 一 组 物品 评分 ， 要 么 是 用 户 自己 选择 一 
组 物品 评分 。 这 些 初始 评分 就 构成 了 用 户 资料 。 由 于 用 户 是 根据 相似 兴趣 或 历史 偏好 被 推 
荐 的 ， 这 类 系统 又 通常 称 为 协同 过 滤 推 荐 系统 。 因 为 这 个 原因 ， 这 类 系统 也 被 称 为 社会 化 
推荐 系统 。 协 同 算法 的 工作 的 细节 可 以 在 文献 [1] 中 找到 。 最 近 有 些 网 站 ， 如 tripadvi- 
sor. com， 通 过 使 用 同一 物品 多 项 属性 的 评分 来 得 到 更 精确 的 用 户 偏好 资料 。 


16.3.3 基于 案例 的 推荐 系统 


这 类 系统 将 用 户 感 兴趣 物品 的 相似 物品 推荐 给 用 户 。 每 个 产品 都 可 看 作 拥有 多 重 属性 
的 案例 。 基 于 内 容 [1] 和 基于 案例 [7] 的 技术 被 用 于 分 析 有 效 产品 的 属性 值 和 用 户 已 知 仿 
好 ， 并 根据 排序 方法 确定 一 个 或 多 个 最 优 排序 选项 。 


16. 3.4 基于 效用 的 推荐 系统 


基于 效用 的 推荐 ， 如 基于 实例 评价 的 推荐 系统 ， 是 基于 用 户 对 多 重 属性 产品 的 偏好 描 
述 推荐 物品 。 多 属性 产品 适用 于 将 所 有 有 效 数据 都 用 相同 的 属性 集合 {al ，…，a4) 来 表示 
的 编码 方案 ， 其 中 每 个 属性 a; 可 以 是 相应 d (a;) 值 集中 任何 一 个 值 v。 如 电子 市 场 上 所 有 
的 数码 相机 可 以 被 分 为 以 下 属性 : 制造 商 、 价 格 、 分 辩 率 、 镜 头 、 内 存 、 屏 幕 大 小 、 厚 度 
和 质量 等 。 可 见 ， 不 同 的 商品 类 型 拥有 不 同 的 属性 集合 。 我 们 假定 用 户 的 偏好 是 完全 依赖 
于 商品 的 属性 值 ， 因 此 两 个 属性 值 相 同 的 商品 ， 它 们 对 于 用 户 拥 有 相同 的 偏好 度 。 另 外 ， 
这 里 提 到 的 商品 ， 如 数码 相机 、 笔 记 本 和 公寓 ， 都 会 要 求 有 一 定 的 财务 负担 。 这 些 商 品 称 
作 高 参与 度 商 品 ， 因 为 用 户 被 期 望 具有 足够 的 诚意 与 系统 交互 ， 参 与 选择 过 程 ， 并 花费 一 
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定数 量 的 代价 处 理 信息 [62]。 并 且 在 这 种 环境 下 ， 相 比 于 书籍 、DVD、 文 章 等 更 简单 的 物 
品 ， 用 户 可 能 会 有 更 复杂 的 决策 行为 。 

使 用 这 些 技术 的 推荐 系统 也 称 作 基于 知识 的 推荐 系统 [7] 和 基于 效用 的 决策 支持 系统 
(Decision Support Interface Systems，DSIS)[62]。 这 里 的 效用 ， 是 指 那些 被 用 来 计算 产 
品 是 否 满足 用 户 偏好 的 多 重 属性 效用 理论 。 一 个 相关 的 技术 ， 特 别 是 用 于 检索 可 配置 产品 
上 ， 使 用 了 约束 补偿 的 技术 [45]。 基 于 效用 的 (UBR) 和 基于 案例 的 (CBR) 推 荐 系统 ， 其 区 
别 在 于 效用 这 两 个 字 ， 对 于 前 者 ， 用 户 偏好 更 重要 ， 但 却 被 后 者 忽视 。 此 外 ， 重 要 性 权衡 
的 概念 是 UBR 决策 的 重要 部 分 。 本 质 上 UBR 推荐 的 是 决策 ， 而 不 仅仅 是 相似 产品 。 详 细 
信息 请 看 本 节 中 的 权衡 推理 。 


16.3.5 基于 评价 的 推荐 系统 


基于 案例 的 和 基于 效用 的 推荐 系统 ， 都 可 以 通过 增加 额外 的 评价 的 交互 步骤 ， 来 提升 
推荐 效果 。 基 于 评价 的 产品 推荐 系统 ， 通 过 模拟 一 个 虚构 的 卖家 ， 来 根据 用 户 当 前 偏好 推 
荐 可 选集 ， 然 后 根据 类 似 于 “我 想 要 更 便宜 的 ”或 “更 快 的 处 理 速度 ”的 评价 形式 ， 来 收集 用 
户 的 反馈 信息 。 这 些 评价 方法 ， 可 以 通过 预测 在 下 一 次 推荐 周期 中 的 需求 ， 来 帮助 代理 者 
提高 准确 率 。 可 能 需要 多 次 周期 ， 直 到 用 户 最 终 找到 了 理想 商品 。 用 户 不 太 可 能 描述 出 他 
们 所 有 的 偏好 ， 特 别 是 对 于 不 熟悉 的 商品 ， 因 此 偏好 评价 代理 是 个 有 效 的 方法 ， 从 而 能 够 
帮助 用 户 逐 步 构建 偏好 模型 ， 并 且 随 着 用 户 有 更 多 的 候选 项 进而 不 断 地 得 到 修正 。 


16.3.6 其 他 设计 指导 准则 


基于 我 们 团队 最 近 在 进行 基于 偏好 的 检索 和 推荐 系统 的 交互 技术 的 研究 ， 本 章 推导 出 
了 一 套 可 用 性 设计 准则 。 在 本 节 中 ， 我 们 将 不 再 回顾 对 积累 这 些 准 则 列表 有 过 贡献 的 相关 
工作 ， 而 是 将 这 些 讨论 放 到 本 章 各 处 有 关 如 何 构造 这 些 准则 的 地 方 。 我 们 将 描述 两 篇 论 
文 ， 这 两 篇 论文 在 决策 支持 系统 方面 ， 提 出 如 何 推导 出 良好 的 设计 准则 。 第 一 项 参考 的 工 
作 ， 从 市 场 调查 角度 出 发 ， 抽 象 出 了 一 套 推 荐 工具 ， 能 够 提高 用 户 参 与 在 线 或 网 站 系统 交 
互 的 积极 性 。 第 二 项 参考 的 工作 ， 在 设计 高 风险 结果 决策 问题 上 上， 描述 了 一 系列 “构建 代 
码 ” 的 指导 准则 ， 来 提升 偏好 构建 的 效果 。 

根据 对 那 时 可 用 的 基于 偏好 的 产品 搜索 和 推荐 工具 虽 显 挑剔 但 也 合情合理 的 看 法 ， 
Spiekermann 和 Paraschiv 提出 了 9 项 推荐 设计 建议 用 来 模拟 和 增强 用 户 与 系统 之 间 的 交 
互 意愿 L62]， 但 是 ， 这 些 建议 与 我 们 的 准则 没有 重 秋 的 地 方 。 

这 些 建 议 中 的 大 部 分 标准 ， 都 是 从 与 信息 检索 相关 的 营销 文献 和 感知 风险 理论 得 来 
的 ， 该 理论 将 用 户 与 产品 推荐 系统 交互 的 意愿 定义 为 她 想 降 低 与 购买 决策 相关 的 各 种 机 能 
上 、 财 务 上 和 情感 上 风险 的 动机 。 因 此 ， 这 些 建议 是 从 减轻 用 户 各 项 风险 角度 抽象 出 来 
的 。 与 我 们 的 工作 相 比 ， 这 是 一 个 水 平 的 方法 论 ， 它 覆盖 了 整个 电子 商务 网 站 的 设计 过 
程 ， 而 推荐 系统 这 一 手段 只 是 其 中 的 主要 技术 组 件 。 而 我 们 是 对 推荐 系统 引擎 的 交互 技术 
进行 深入 的 探究 ， 是 一 个 垂直 的 方法 论 ， 保 证 消费 者 能 够 在 与 推荐 系统 交互 时 的 偏好 提取 
和 决策 中 ， 得 到 最 理想 的 可 用 的 支持 。 

虽然 做 出 高 风险 决策 是 更 应 该 受到 关注 的 主题 ，Payne 等 [41] 提 出 的 评价 方法 ， 在 解 
决 消费 者 面临 购买 决策 问题 的 需求 和 偏好 问题 上 和 我 们 的 目标 是 类 似 的 。 他 们 的 工作 挑战 
了 在 精细 化 和 预先 偏好 上 的 许多 传统 假设 ， 也 提出 了 构建 偏好 的 理论 。 在 新 的 框架 下 ， dE 
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者 提出 了 一 套 “ 构 建 代 码 ”( 类 似 于 指导 准则 )， 来 帮助 专业 的 决策 者 建立 价值 函数 和 做 出 高 
质量 的 决策 。 当 然 ， 在 基于 人 类 偏好 的 天 性 上 ， 构 建 和 评估 偏好 方法 上 ， 以 及 如 何 处 理 好 
平衡 来 得 到 合理 的 决策 ， 他 们 的 相关 研究 ， 深 深 地 影响 了 我 们 的 工作 。 本 章 的 相关 部 分 将 
详细 介绍 行为 决策 研究 中 这 部 分 以 及 其 他 工作 的 参考 文献 。 


16.4 初始 偏好 提取 


实例 评价 系统 是 一 个 决策 工具 ， 可 以 帮助 用 户 寻 找到 多 属性 的 商品 ， 如 航班 、 数 码 相 
机 、 笔 记 本 电脑 等 。 我 们 使 用 PSC, w) (1 过 i 过 nn) 来 描述 基于 效用 的 推荐 系统 中 ， 用 
户 对 于 整个 维 属性 集 商 品 的 偏好 ，a; 表示 第 i 维 属性 的 要 求 指标 ，w; 表示 该 项 指标 的 满 
足 程度 。 这 个 模型 在 文献 [24] 中 也 被 称 为 价值 函数 。 而 很 多 推荐 系统 称 为 用 户 偏好 模型 ， 
当然 ， 有 些 方法 假定 所 有 的 属性 值 拥有 相同 的 权重 ， 因 此 不 会 抽取 这 些 信 息 L9，53]。 偏 
好 提取 (也 被 称 为 查询 指定 )， 是 获得 用 户 信息 的 初始 化 过 程 。 

很 明显 ， 用 户 的 偏好 也 可 以 通过 让 用 户 回答 一 些 简单 的 问题 来 获得 。 许 多 在 线 的 检索 
工具 使 用 图 形 化 界面 填 表 或 自然 语言 对 话 框 的 方式 来 收集 用 户 的 这 些 信 息 。 这 些 情 况 下 ， 
用 户 被 要 求 陈 述 他 们 在 各 个 方面 的 偏好 ， 如 起 飞 和 达到 时 间 、 航 线 和 中 转机 场 等 ， 并 且 必 
须 填 写 所 有 的 选项 ， 这 种 方法 也 被 称 作 非 递 进 式 的 ， 因 为 所 有 偏好 必须 在 开始 时 被 收 
集 到 。 

这 种 简单 的 方法 为 什么 会 不 管用 呢 ? 先 让 我 们 从 行为 决策 的 角度 来 试 着 理解 用 户 的 偏 
好 表达 方式 。 根 据 自 适 应 决策 理论 L40]， 用 户 的 偏好 也 是 自 适 应 的 ， 也 是 与 当前 的 决策 现 
状 息息相关 的 。 根 据 这 一 原则 ， 用 户 在 没有 得 到 任何 利益 前 [62]， 可 能 会 不 太 愿意 去 回答 
那些 初始 引导 问题 ， 也 有 可 能 他 们 缺乏 足够 的 领域 知识 来 正确 回答 问题 。 也 就 是 说 ， 如 果 
系统 在 开始 时 ， 要 求 很 重 的 选择 过 程 ， 采 集 到 的 偏好 信息 有 可 能 是 不 准 的 或 是 错误 的 。 

相似 的 研究 揭示 ， 用 户 的 偏好 是 依赖 于 上 下 文 环境 的 ， 也 是 根据 他 们 的 需求 ， 在 逐步 
获得 更 丰富 的 领域 信息 后 ， 逐 步 建立 起 来 的 [40，41]。 例 如 ，Tversky 等 做 了 一 个 关于 要 
求 受 试 者 购买 微波 炉 的 用 户 调研 [66]， 实 验 的 参与 者 被 分 为 两 组 ， 每 组 60 人 。 第 一 组 ， 
每 个 用 户 都 有 两 个 选择 ， 一 个 是 Emerson 售 价 110 美元 ， 另 一 个 是 Panasonic 售 价 180 美 
元 ， 并 且 两 者 在 标价 上 都 显示 当前 价格 是 原价 的 2/3。 结 果 表 明 ， 仅 有 43% 的 参与 者 选择 
180 美元 的 微波 炉 。 第 二 组 ， 除 了 上 述 两 个 选择 外 ， 还 增加 了 一 个 Pannasonic 当前 售 价 
200 美元 ， 是 原价 的 9 折 。 这 种 情况 下 ，60% 的 参与 者 选择 了 180 美元 的 微波 炉 。 很 明显 ， 
仅仅 是 参考 选项 的 改变 ， 就 促使 了 更 多 的 人 选择 同样 的 物品 。 这 一 发 现 恰好 说 明了 ， 用 户 
的 偏好 在 初始 时 是 很 难 揭 露出 来 的 ， 但 可 以 在 逐步 获得 更 丰富 的 信息 后 逐步 建立 起 来 。 

为 了 验证 这 些 典 型 的 行为 理论 ， 是 否 在 在 线 环 境 中 依然 有 效 ， 我 们 也 进行 了 几 项 实验 
研究 。 在 此 ，22 位 参与 者 被 要 求 与 偏好 提取 界面 进行 交互 [67]， 用 户 开始 时 只 能 描述 平 
均 2. 1 项 属性 (总 共 10 项) 上 的 自身 的 偏好 情况 ， 直 到 最 后 做 出 选择 时 ， 他 们 对 自身 偏好 
的 各 项 属性 值 描述 程度 ， 也 只 达到 了 平均 4.19 项 。 

还 有 一 项 研究 ， 也 证 明了 用 户 不 太 可 能 在 初始 时 描述 出 其 自身 所 有 的 偏好 。 这 项 研究 
在 用 户 交互 过 程 中 ， 对 比 了 不 递增 选项 和 每 次 交互 递增 一 个 选项 两 种 不 同 的 情况 下 [68]， 
用 户 检索 商品 的 准确 率 和 代价 。 这 里 ， 不 递增 选项 的 过 程 ， 是 指 用 户 需要 在 单一 的 图 形 界 
面 上 填写 出 其 所 有 的 偏好 。 而 每 次 交互 增加 一 个 ， 是 指 每 一 个 偏好 结果 都 是 由 用 户 决定 
的 。 实 验 中 ，40 位 参与 者 被 随机 均 分 为 两 组 ， 每 组 被 指派 到 一 个 需 评估 的 系统 (不 递增 或 
递增 ) 中 。 非 递增 的 方法 中 ， 用 户 可 以 描述 出 平均 7. 5 项 属性 值 ( 总 共 10 项 ) 上 的 偏好 ， 而 
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递增 的 方式 也 是 同样 的 结果 。 可 是 ， 同 样 的 用 户 代 价 下 ， 递 增 的 方式 拥有 70% 的 准确 率 ， 
而 非 递 增 只 有 25% 。 也 就 是 说 ， 在 非 递增 填 表 方 式 中 ， 只 有 25% 的 用 户 找到 了 他 们 想 要 
的 商品 。 可 见 ， 非 递增 的 方式 可 能 能 产生 出 同样 的 数据 ， 但 是 不 一 定 能 有 同样 的 质量 ， 当 
然 ， 当 用 户 的 偏好 仍然 不 确定 时 ， 用 户 可 能 不 会 提供 准确 的 和 持续 的 属性 描述 。 

— 在 基于 协同 过 滤 系统 中 的 偏好 提取 过 程 ， 也 有 同样 的 发 现 。McNee 等 对 比 了 新 用 户 
对 于 电影 评分 三 种 不 同 的 界面 策略 的 效果 [34]。 第 一 种 策略 ， 系 统 让 用 户 对 选择 的 电影 进 
行 评 分 ， 来 最 大 限度 获得 用 户 偏好 模型 ， 这 里 ， 系 统 决 定 了 用 户 需要 对 哪些 电影 进行 评 
分 。 第 二 种 策略 ， 用 户 可 以 对 任意 的 电影 进行 评分 。 第 三 种 策略 ， 混 合 了 前 两 种 ， 用 户 可 
以 选择 前 两 种 之 一 。 总 共 225 位 新 用 户 参 与 这 项 实验 ， 结 果 说 明 ， 相 比 于 其 他 两 种 策略 ， 
用 户 控 制 的 策略 (第 三 种 ) 可 以 得 到 更 高 的 推荐 准确 率 。 另 外 ， 用 户 控制 的 界面 ， 更 能 促使 
用 户 再 次 回 到 系统 进行 更 多 评分 。 总 之 ， 这 项 研究 说 明了 ， 在 同等 交互 代价 下 ， 更 高 精度 
用 户 自身 控制 的 方法 ， 可 以 得 到 更 高 准确 率 的 偏好 模型 。 

递增 的 偏好 提取 方法 [1，5]， 在 一 般 情况 下 ， 也 可 以 用 来 修正 用 户 的 偏好 ， 或 价值 函 
数 。 其 他 的 递增 式 方法 。 其 他 递增 方法 在 特定 领域 也 能 改善 决策 质量 。 在 文献 [6，36， 
42] 中 ， 研 究 者 通过 强调 在 用 户 一 系统 交互 的 早期 展现 一 组 多 样 性 选项 的 重要 性 ， 解 决 了 
偏好 不 确定 性 的 问题 。Faltings 等 [13，69，70] 描 述 了 多 种 刺激 用 户 描述 更 多 的 偏好 ， 进 
而 增加 决策 准确 率 。Pu 和 Faltings 展示 了 如 何在 偏好 修正 中 获得 更 多 的 偏好 信息 ， 特 别 
是 如 何 解决 用 户 权衡 任务 [45]。 更 多 的 这 方面 细节 请 看 16. 5. 2 节 和 16. 6 节 。 

基于 经 典 的 和 近期 的 经 验 性 发 现 ， 在 偏好 提取 过 程 中 ， 我 们 推导 出 了 有 关 初 始 偏好 提 
取 过 程 的 多 项 设计 指导 准则 : 

指导 准则 1 任意 代价 : 要 考虑 新 用 户 偏 好 的 流畅 性 。 克 许 用 户 逐 步 揭示 自身 偏好 。 最 好 
是 抽取 出 和 他 们 最 相关 的 初始 偏好 ， 并 且 选 择 与 他 们 对 于 可 选项 的 知识 和 经 验 相 适 应 的 代价 
等 级 。 

一 个 死板 的 提取 过 程 ， 通 过 使 用 一 个 事先 已 经 定 序 的 提取 过 程 来 获得 用 户 的 偏好 。 当 
用 户 被 强制 地 要 求 在 特定 顺序 或 属性 上 表现 偏好 时 ， 这 与 他 们 真实 的 意愿 是 不 一 致 的 ， 他 
们 会 错误 地 得 出 手段 目标 ， 而 无 法 达成 根本 目标 [23]。 例 如 ， 当 用 户 想 要 购买 机 票 时 ， 系 
统 可 能 首先 让 其 选择 航空 公司 ， 而 不 是 航线 。 这 样 ， 根 本 目标 是 要 在 特定 时 间 飞 行 的 用 户 
不 得 不 得 出 一 个 不 同 的 目标 ， 也 就 是 选择 航空 公司 ， 作 为 达成 根本 目标 的 手段 。 为 了 将 真 
实 目标 转换 为 手段 目标 ， 用 户 需 要 得 到 更 丰富 的 信息 ， 如 不 同 航线 的 航班 时 间 表 。 有 可 能 
是 开始 时 用 户 了 解 的 不 足 ， 导 致 其 不 能 得 到 最 优 的 结果 。 因 此 提出 准则 2. 

指导 准则 2 ”任意 顺序 .用户 可 以 选择 任意 顺序 描述 自身 的 偏好 。 

如 果 不 能 允许 用 户 在 足够 丰富 的 属性 集合 中 ， 描 述 出 其 偏好 ， 那 么 这 个 提取 过 程 也 是 
死板 的 。 有 这 么 个 例子 [70]， 在 出 行 计 划 系 统 中 ， 假 定 用 户 想 在 15 点 前 达到 目的 地 ， 可 
系统 只 允许 用 户 在 检索 时 设置 起 飞 时 间 ， 此 时 可 能 用 户 会 错误 地 认为 这 次 旅程 需要 转机 并 
且 要 飞行 5 个 小 时 ， 那 用 户 就 会 设置 起 飞 时 间 为 10 点 。 其 实 有 个 12 点 半 起 飞 的 直 飞 航班 
14 点 半 就 能 达到 目的 地 ， 用 户 就 未 能 搜索 到 。 

手段 目标 是 实现 最 终 决 策 的 中 间 过 程 。 假 定 一 个 用 户 对 于 属性 a;( 如 到 达 时 间 ) 有 个 偏 
好 ， 但 是 系统 只 允许 用 户 对 属性 w (如 起 飞 时 间 ) 设 置 偏好 ， 则 用 户 可 能 会 估算 出 一 个 映射 
KR tla), KAHE ai 的 值 映射 到 属性 a; 的 值 (如 达到 时 间 = 起 飞 时 间 十 5 小 时 ) ， 然 后 用 
户 的 实际 目标 plaj) 转 换 为 手段 目标 a(a)) — pG(a,)) ， 可 是 如 果 映 射 方法 是 错误 的 ， 那 手 
段 目标 就 会 导致 不 准确 的 结果 。 
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除非 属性 a 与 属性 a; 有 非常 强 的 关系 ， 否 则 实际 上 是 不 存在 准确 的 转换 关系 的 。 近 
期 对 一 个 购物 比较 网 站 (www. pricegrabber. com) 的 一 次 访问 表明 : 它 就 没有 考虑 笔记 本 
电脑 的 质量 属性 。 可 是 对 于 侧重 便携 性 的 用 户 ， 质 量 却 是 最 重要 的 因素 。 此 时 ， 当 没有 质 
量 属性 可 以 参考 时 ， 消 费 者 会 将 质量 关联 到 大 小 或 是 硬盘 的 容量 上 。 因 此 ， 她 往往 会 检索 
硬盘 空间 小 和 屏幕 小 的 笔记 本 电脑 来 蔡 代 。 这 就 导致 了 用 户 做 出 了 一 些 不 必要 的 牺牲 ， 因 
为 许多 生产 厂家 现在 可 以 在 适合 的 硬盘 和 屏幕 尺寸 的 基础 上 ， 提 供 质量 轻 的 笔记 本 电脑 。 
因此 我 们 提出 了 准则 3。 

指导 准则 3 任意 偏好 : 允许 用 户 选择 表述 任意 属性 上 的 偏好 。 

当 设计 用 户 交 互 界面 时 ， 非 常 有 必要 的 是 ， 在 给 予 用 户 最 大 的 控制 权限 与 陷 人 交互 复 
杂 度 之 间 保 持 很 好 的 平衡 。 我 们 推荐 使 用 自 适 应 的 交互 界面 ， 让 用 户 能 够 设 定 侧重 的 属性 
值 上 偏好 ， 可 以 忽略 某 些 并 不 关注 的 属性 值 。 另 一 方面 ， 在 初始 查询 指定 中 ， 设 计 者 也 可 
以 采用 逐步 上 升 的 方法 ， 让 用 户 在 最 初 一 小 部 分 属性 上 指明 偏好 后 ， 进 一 步 在 显示 的 结果 
上 设置 自身 偏好 。 


16.5 通过 实例 激励 用 户 表示 偏好 


一 个 有 效 的 提取 工具 必须 能 够 使 用 递增 的 和 灵活 的 方式 收集 用 户 的 偏好 。 实 践 中 ， 我 
们 也 对 能 够 激励 用 户 表述 偏好 的 方法 感 兴趣 。 

并 非 所 愿 的 手段 目标 常常 是 因为 用 户 对 于 当前 可 用 选项 不 熟悉 。 同 时 ， 行 为 理论 发 现 
用 户 在 有 实例 的 情况 下 ， 能 容易 地 表述 出 自己 的 真实 要 求 L41]。 根 据 Tversky 的 研究 
[65]， 人 们 虽然 不 能 预先 算出 偏好 顺序 ， 但 是 可 以 从 当前 选项 中 做 出 自己 的 选择 。 这 些 经 
典 的 理论 也 就 证 明了 为 什么 实例 评价 在 构建 偏好 时 是 个 很 有 效 的 方法 [43，47j]。 

这 一 方法 被 称 作 实 例 评价 ， 是 因为 用 户 是 通过 评价 展现 给 他 们 的 实例 产品 来 构建 自身 
的 偏好 的 。 用 户 初始 时 可 以 在 任意 数目 的 相关 属性 上 表述 自身 的 偏好 。 然 后 ， 系 统 激 励 用 
户 进行 多 项 被 称 为 “示例 和 批判 ?的 周期 系统 让 用 户 进 入 连续 不 断 的 “实例 和 评价 ”循环 : 展 
示 了 一 系列 实例 产品 ， 让 用 户 进行 类 似 于 “我 喜欢 这 款 笔记 本 ， 但 是 想 要 个 硬盘 空间 更 大 
的 ”这 样 的 评价 。 这 些 评价 结果 决定 了 下 一 个 循环 需要 展示 的 产品 ， 当 用 户 找 到 了 想 要 的 
产品 时 ， 整 个 交互 过 程 就 结束 了 人 。 . 

通过 实例 评价 方法 ， 用 户 可 以 快速 地 构建 出 自身 的 偏好 。 由 于 用 户 只 需要 做 出 实例 评 
价 ， 而 不 是 提供 偏好 ， 整 个 过 程 对 用 户 来 说 ， 所 需要 的 代价 也 更 小 。 更 重要 的 是 ， 实 例 评 
价 方法 既 能 满足 给 用 户 展示 当前 已 有 产品 的 目标 ， 也 能 刺激 用 户 在 当前 状况 下 构建 偏好 。 

我 们 将 回顾 一 整套 评价 系统 ， 然 后 抽象 出 能 够 描述 这 个 方法 效果 的 指导 原则 ， 更 详细 
的 信息 请 参考 Lorraine McGinty 和 James Reilly 在 本 书 中 第 13 章 。 

实例 评价 方法 最 早出 现时 ， 是 作为 一 项 新 的 数据 库 访 问 范 型 ， 特 别 是 给 新 手 用 户 指明 
查询 要 求 [72]。 近 期 ， 实 例 评价 被 广泛 使 用 ， 主 要 有 两 种 形式 : 支持 产品 目录 导航 和 支持 
基于 显 性 偏好 模型 的 产品 检索 。 

第 一 类 实例 评价 系统 ， 如 FindMe 系统 [8，9]， 检 索 被 认为 是 多 项 搜索 的 组 合 ， 而 浏 
览 则 仅 用 于 辅助 。 这 些 首先 根据 用 户 的 初始 查询 ， 展 示 数 据 库 中 最 匹配 的 产品 ， 然 后 根据 
用 户 的 评价 重新 检索 出 当前 最 合适 的 。 按 照 评 价 模型 实现 的 界面 ， 也 称 为 调整 ， 即 允许 用 
户 对 当前 示例 做 出 偏好 表述 ， 如 “ 找 一 个 与 这 个 类 似 的 ,但 是 周边 环境 更 好 的 ”。 根 据 这 一 
概念 ， 用 户 可 以 调整 当前 推荐 来 得 到 更 满意 的 结果 。 偏 好 模型 通过 当前 最 佳 产品 隐 式 地 表 
示 出 来 ， 也 就 是 说 ， 用 户 所 选 的 反映 了 她 对 于 属性 值 的 偏好 。 在 对 调整 模型 改进 的 基础 
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E, Reilly 等 提出 了 动态 评价 模型 [53]。 除 了 对 单个 值 的 调整 操作 ， 组 合 评价 还 允许 用 户 
选择 与 当前 最 佳 物品 有 两 个 或 更 多 属性 值 不 同 的 产品 。 例 如 ， 初 始 查询 后 ， 系 统 给 用 户 推 
荐 了 一 款 数码 相机 ， 以 及 不 同 厂 家 生产 的 像素 更 低 但 空间 更 大 的 相机 。 根 据 Apriori 算法 
[2] 产 生 的 组 合 评价 的 方法 ， 人 允许 用 户 通过 更 大 的 跨度 ， 引 导出 他 们 的 目标 选项 。 实 际 上 ， 
在 真实 用 户 参 与 的 一 项 调研 [32] 中 ， 频 繁 使 用 组 合 评价 的 用 户 能 够 将 他 们 的 交互 循环 从 29 
次 降低 到 6 次 。 

第 二 类 实例 评价 系统 ， 需 要 维护 一 个 显 性 的 偏好 模型 。 每 个 用 户 的 反馈 以 评价 的 方式 
被 加 入 进来 细 化 原始 的 偏好 模型 。 提 供出 行 计划 的 SmartClient 系统 就 使 用 了 这 种 模 
型 [43，63]。 一 旦 用 户 设 置 好 初始 偏好 ， 它 就 能 提供 30 组 实例 。 当 然 ， 在 评价 实例 的 过 
程 中 ， 用 户 可 能 会 表述 出 额外 的 偏好 。 这 些 偏好 会 积累 到 一 个 可 以 通过 接口 让 用 户 可 见 的 
模型 中 (参见 [64] 中 图 16.6 中 “偏好 ”下 方 的 底 栏 )， 而 且 可 以 随时 修改 。ATAL28]、Ex- 
pertClerk[60]、The Adaptive Place Advisor[16] 以 及 那些 递 进 式 动态 评价 系统 的 都 具有 相 
似 的 功能 [30]。 维 护 一 个 显 性 的 模型 有 两 个 优点 : 一 是 可 以 避免 推荐 那些 用 户 排除 的 产 
品 ; 二 是 可 以 帮助 系统 推荐 那些 用 户 自 己 忽 略 掉 的 产品 ，16. 5. 2 节 将 详细 地 描述 。 

因此 ， 为 了 给 用 户 提供 相关 的 领域 知识 ， 以 及 刺激 用 户 构 建 完 整 健全 的 偏好 ， 我 们 提 
出 准则 : 

指导 准则 4: 给 用 户 提供 示例 ， 帮 助 其 更 流畅 地 描述 偏好 。 


16.5.1 需要 多 少 实例 


在 设计 高 效 的 基于 实例 的 界面 时 有 两 个 关键 点 : 一 个 是 需要 实例 的 数目 ， 另 一 个 是 需 
要 展示 实例 的 类 型 。Faltings 等 分 析 多 种 偏好 模型 ， 提 出 了 在 推荐 模型 不 准 的 情况 [14]， 
至 少 需要 展示 给 用 户 多 少 实例 ， 并 使 得 目标 选择 也 被 包含 进来 。 他 们 分 析 了 各 种 偏好 模 
型 。 如 果 用 数值 效用 函数 表示 的 偏好 与 实际 偏好 的 偏差 度 是 es， 而 且 采 用 加 权 总 和 或 最 小 
一 最 大 规则 将 它们 组 合 起 来 ， 则 有 


t = EA (16. 4) 

KB. d 需要 陈述 偏好 的 最 大 数目 ，: 是 要 确保 包含 目标 方案 时 需要 展示 的 物品 数目 。 

由 于 这 个 数目 与 系统 物品 总 数 是 无 关 的 ， 这 项 技术 也 可 以 支持 大 型 数据 集 的 系统 。 对 于 一 

个 中 等 数目 的 偏好 (最 多 为 5) ， 最 准确 实例 数目 是 5 一 20。 当 偏好 模型 更 复杂 时 ， 可 能 会 
放大 不 准确 度 ， 此 时 需要 更 多 实例 。 


16.5.2 ”需要 哪些 实例 


最 显而易见 要 展示 的 实例 是 那些 最 能 匹配 用 户 当 前 偏好 的 实例 。 然 而 ， 这 个 策略 被 证 
明 并 不 能 确保 是 最 优 的 。 由 于 绝 大 多 数 用 户 并 不 确定 自己 的 偏好 ， 所 以 引导 用 户 构建 一 个 
尽 可 能 完整 和 准确 的 偏好 模型 ， 对 于 推荐 系统 更 为 重要 。 可 见 ， 系 统 需 要 在 用 户 角 度 上 提 
供 更 多 的 选择 。 因 此 我 们 称 被 选择 用 来 激励 用 户 的 实例 为 建议 。 我 们 给 出 了 两 类 建议 策 
略 ， 基 于 多 样 性 和 基于 模型 的 技术 。 

ATA 系统 是 最 先 使 用 建议 的 [28]， 其 实例 覆盖 了 多 项 属性 ， 如 起 飞 时 间 和 价格 ， 也 
提供 了 扩展 选项 ， 如 更 早 的 和 更 便宜 的 。 可 是 ， 这 些 扩展 选项 对 于 许多 用 户 来 说 ， 都 是 没 
有 意义 的 。 例 如 ， 某 个 用 户 需 要 更 高 分 辩 率 的 数码 相机 ， 但 并 不 意味 着 他 可 以 接受 四 倍 于 
一 般 相机 的 分 辨 率 但 也 是 四 倍 价格 的 相机 ， 实 际 上 ， 如 果 系 统 进行 了 这 样 的 推荐 ， 有 可 能 
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会 打击 到 用 户 ， 因 为 这 样 暗示 了 只 能 通过 提高 开支 来 提高 性 能 。 
因此 ， 更 好 的 选择 是 在 那些 根据 当前 已 知 偏好 判断 为 好 的 实例 中 建议 ， 而 且 要 强调 多 
样 性 而 不 是 极端 的 实例 。Bradley 和 Smyth 首先 意识 到 了 多 样 实例 的 重要 性 ， 特 别 是 对 于 
采用 推荐 工具 的 早期 阶段 L6]。 他 们 提出 了 边界 贪心 算法 (Bounded Greedy Algorithm), 
使 得 用 户 能 够 在 检索 到 与 用 户 查 询 词 最 相似 结果 的 同时 也 能 包括 最 多 样 性 的 结果 。 因 此 ， 
该 算法 并 没有 根据 偏好 r(xz)， 提 供 & 个 最 匹配 的 实例 ， 而 是 根据 加 权 总 和 和， 用 d(x,，Y) 计 
算 实例 x 和 已 选集 合 Y 的 相对 多 样 性 : 
sCr,Y) = ar(z)++ (1 —a)d(zr,Y) (16. 5) 
Kp. .权重 a 可 以 根据 最 优 性 和 多 样 性 各 自重 要 程度 的 变化 而 变化 。 例 如 ， 当 用 户 得 
到 最 终 选项 时 ，a 可 能 会 是 个 很 大 的 值 (实验 中 是 0.75)， 这 样 系统 就 会 强调 展示 集合 的 相 
似 度 而 不 是 多 样 性 。 在 他 们 的 实现 中 ， 排 序 函 数 ~(z) 是 z 与 理想 实例 上 + 在 0 到 1 之 间 的 相 
似 度 simCx, D, ， 相 对 多 样 性 可 以 推导 为 


d(r,Y) = 1— 4L. Y simi 3? (16. 6) 
(ET 


多 样 性 产生 的 效果 可 以 根据 相对 收益 来 模拟 得 出 ， 也 就 是 说 ， 由 于 放弃 相似 度 而 在 多 
样 性 方面 得 到 的 最 大 收益 L61]。 随 后 ，McSherry 等 也 说 明了 可 以 在 不 牺牲 相似 度 的 条 件 
下 提高 多 样 度 L36]。 在 排序 函数 中 固定 一 个 阀 值 *， 然 后 在 所 有 的 产品 x PRM (2) DE 
就 能 选 出 最 具 多 样 性 的 子 集 。 当 显示 了 个 选项 时 ， 阔 值 可 以 是 第 个 选项 ， 这 样 就 能 保 
证 相似 度 不 会 减少 ， 或 者 是 某 个 具体 的 值 ， 这 样 相似 度 就 会 有 一 定 程度 的 减少 。 | 

因此 我 们 提出 了 以 下 准则 : 

指导 准则 5: 给 用 户 提供 多 样 性 的 实例 ， 特 别 是 在 用 户 不 确定 其 最 终 偏 好 的 情况 下 ， 
可 以 刺激 用 户 表述 自身 偏好 。 

文献 [33j 采 用 的 自 适应 搜索 算法 ,通过 改变 排序 策略 中 的 a， 交替 采用 侧重 相似 度 和 
侧重 多 样 性 这 两 种 策略 ， 实 现 了 “展示 给 我 更 多 类 似 ” 这 样 的 交互 。 这 种 情况 下 ， 当 实例 产 
品 集 展示 后 ， 用 户 可 以 选择 出 他 们 最 喜欢 的 选项 。 当 用 户 连续 两 次 选择 同一 个 选项 时 ， 系 
统 在 下 一 轮 的 实例 中 ， 将 会 侧重 于 多 样 性 来 提高 用 户 的 关注 度 。 否 则 系统 会 假设 用 户 还 在 
摸索 ， 则 继续 给 用 户 提供 新 的 选项 。 有 模拟 用 户 参 与 的 评估 表明 ， 这 一 一 技术 与 纯 基于 相似 
度 的 推荐 系统 相 比 ， 最 多 可 以 将 推荐 循环 的 长 度 减 少 76%。 

最 近 关 于 多 样 性 的 工作 ， 主 要 是 针对 那些 用 户 偏好 不 确定 的 情况 L422]， 以 及 覆盖 协同 过 
滤 推 荐 系统 中 不 同类 型 的 兴趣 [74]。 对 于 一 般 的 偏好 模型 ， 如 何 定义 多 样 性 指标 还 不 是 很 清 
楚 。Viappiani 等 在 文献 [69，70，50] 中 考虑 了 当 展 示 建 议 时 ， 用 户 会 有 意愿 说 出 更 多 的 偏 
好 。 一 个 建议 在 当前 的 偏好 模型 中 可 能 不 是 最 优 的 ， 但 是 在 加 入 更 多 偏好 后 就 更 有 可 能 是 最 
优 的 。 例 如 ， 某 个 用 户 在 浏览 公寓 实例 后 ， 可 能 会 添加 “需要 带 阳台 的 公寓 ”这 一 偏好 。9 个 
不 同 国籍 的 40 位 实验 主体 ， 其 中 9 位 女性 ， 参 与 公寓 检索 的 研究 。 实 验 结果 表明 ， 使 用 参 
考 建议 不 仅 可 以 让 准确 率 翻 倍 ， 也 能 减轻 用 户 80%% 的 时 间 消 耗 。 如 果 能 够 得 到 更 好 的 结果 ， 
用 户 也 愿意 给 出 更 多 的 偏好 设置 。 因 此 ， 他 们 提出 了 向 前 看 准则 [69，70，50]; 

指导 准则 6: 当前 偏好 模型 的 建议 可 能 不 是 最 优 的 ， 但 是 在 加 入 更 多 偏好 后 就 更 有 可 
能 是 最 优 的 。 

向 前 看 准则 可 应 用 于 构造 基于 模型 的 建议 ， 方法 是 对 于 任 一 属性 a; 都 会 显 式 地 计算 
差 值 度量 函数 diff(a;，z)， 可 以 反映 在 这 一 属性 上 偏好 能 让 选项 = 最 受 欢迎 的 概率 。 根 据 
物品 在 所 有 可 能 属性 上 的 期 望 差 值 度量 排序 得 到 
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F,(z) = MP, diff(ai,7) (16. 7) 
a, EA 


其 中 ，P。 是 指 用 户 被 激励 去 对 a; 属性 进行 偏好 表述 的 概率 。 将 用 户 还 没有 表述 偏好 
的 所 有 属性 对 应 的 概率 加 起 来 。 因 此 最 应 该 展现 的 建议 就 是 那些 在 考虑 了 隐 偏 好 之 后 最 有 
可 能 成 为 最 优 的 物品 。 将 这 些 技术 综合 起 来 ， 可 以 将 最 优选 项 的 概率 最 大 化 采用 这 些 技 
术 ， 就 有 可 能 得 到 一 组 建议 ， 使 得 得 到 最 优 物品 的 概率 最 大 化 。 详 细 请 看 [13，50]。 为 了 
调查 这 些 建议 在 制定 正确 决策 过 程 中 的 重要 性 ， 有 人 做 了 一 些 实际 的 用 户 研究 L50，69， 
67]。 有 一 项 研究 里 ， 用 户 的 行为 被 在 线 系统 监视 着 ， 研 究 者 记录 了 63 位 参与 者 的 多 轮 偏 
好 修正 循环 。 另 一 项 研究 ， 研 究 者 将 40 位 参与 者 分 为 两 组 。 一 组 是 基于 模型 的 建议 ， 一 
组 则 不 提供 建议 。 这 两 项 研究 都 说 明了 使 用 基于 模型 建议 的 效果 ， 用 户 在 有 建议 的 情况 下 
可 以 描述 更 多 的 偏好 ([69，67] 监 督 研 究 中 ， 有 建议 是 增加 了 2.09 个 偏好 ， 无 建议 仅 增加 
了 0.62, p<0.01; [69，50] 在 线 研究 中 ， 有 建议 是 增加 了 1. 46 个 偏好 ， 无 建议 是 增加 
了 0. 64，p 过 0. 002)， 并 且 用 户 可 以 得 到 更 高 决策 准确 率 ( 在 监督 用 户 研 究 [50] 中 ， 有 建 
WE 80%， 无 建议 仅 有 45%, p<0. 01). 


16.6 偏好 修正 


偏好 修正 是 改变 用 户 之 前 所 说 的 期 望 的 产品 特性 ， 以 及 这 些 特性 有 多 大 程度 需要 满足 ， 
或 者 是 这 两 者 的 组 合 。28 位 受 试 者 (10 位 女性 ) 被 聘 来 参与 从 可 选 的 公寓 中 选 出 其 最 喜欢 的 
[48]。 用 户 的 偏好 可 以 分 为 6 种 属性 : 类 型 、 价 格 、 面 积 、 浴 室 状况 、 厨 房 状 况 以 及 到 工作 
地 点 的 距离 。 每 个 参与 者 首先 都 得 做 出 选择 ， 然 后 使 用 推荐 工具 来 平衡 他 们 的 偏好 ， 直 到 选 
出 理想 的 选项 。 这 个 研究 中 ， 在 检索 过 程 中 ， 每 个 用 户 都 至 少 修改 一 个 偏好 ， 许 多 用 户 更 改 
偏好 是 因为 几乎 没有 哪个 选项 能 够 满足 所 有 的 初始 偏好 。 这 里 ， 最 常见 的 两 种 偏好 修正 的 情 
DUE: 1) 用 户 不 能 找到 满足 其 所 有 偏好 的 选项 ， 不 得 不 选择 满足 部 分 的 ，2) 用 户 可 能 会 有 很 
多 满足 的 结果 ， 不 得 不 减少 选项 集合 的 大 小 。 这 两 种 过 程 都 可 以 看 作 查 询 精确 化 过 程 ， 真 正 的 
挑战 是 帮助 用 户 修改 查询 参数 从 而 找到 目标 物品 。 因 此 ， 我 们 提出 了 一 个 统一 的 框架 ， 可 以 将 
这 两 种 情况 视 为 权衡 过 程 ， 因 为 有 可 能 不 得 不 在 某 方面 做 出 牺牲 ， 来 得 到 可 接受 的 结果 。 


16. 6. 1 偏好 冲突 和 部 分 满足 


某 个 用 户 如 果 在 查询 大 型 公寓 时 ， 要 求 一 个 很 低 的 价格 ， 将 会 得 到 “未 能 找到 符合 要 
求 ” 的 结果 ， 接 下 来 他 将 不 知道 如 何 描述 更 合适 的 偏好 。 

当前 业界 实践 都 是 使 用 基于 浏览 的 交互 技术 来 处 理 偏好 冲突 的 情况 。 用 户 只 能 一 次 提 
交 一 次 自身 偏好 ， 当 他 们 需要 设置 更 多 偏好 时 ， 可 以 在 产品 子 栏目 里 设置 ， 直 到 在 显示 的 
选项 中 找到 目标 ,或 者 再 没有 产品 了 。 例 如 ， 如 果菜 位 用 户 想 要 一 个 很 轻 的 笔记 本 ( 轻 于 2 
千克 )， 当 她 设置 好 质量 要 求 时 ， 就 只 能 在 小 于 2 千克 的 笔记 本 里 进行 进一步 的 搜索 。 如 
果 这 些 轻型 笔记 本 的 价格 非常 高 ， 她 有 可 能 会 错过 那些 质量 是 2. 5 千克 但 便宜 很 多 的 替代 
选择 。 这 种 交互 风格 在 比较 性 购物 网 站 中 很 受 欢迎 (如 www. shopping. com, www. 
pricegrabber. com, www. yahoo. shopping. com) 。 但 这 种 交互 是 很 受 限 制 的 ， 因 为 设计 者 
事先 已 经 避免 了 用 户 选 择 冲突 的 偏好 。 用 户 很 难 设置 上 下 文 相关 的 偏好 ， 特 别 是 把 握 好 各 
项 属性 平衡 。 如 果 用 户 逐 步 对 各 项 属性 进行 设置 ， 匹 配 的 产品 可 能 会 突然 变 为 空 ， 弹 出 提 
示 “ 未 能 找到 匹配 的 物品 ”。 这 种 情况 下 ， 用 户 也 不 知道 该 修正 哪 一 项 属性 ， 有 可 能 得 回 退 
好 几 步 ， 才 能 得 到 其 关注 属性 的 组 合 结果 。 
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SmartClient 使 用 了 一 种 更 合理 的 方法 [43，64]。 首 先 ， 其 允许 用 户 表 述 自身 的 所 有 偏 
好 ， 然 后 给 出 最 大 满足 部 分 偏好 的 选项 子 集合 [15]。 这 些 最 大 满足 的 产品 可 以 帮助 用 户 知道 
当前 可 选 的 物品 有 哪些 ， 也 能 让 其 指定 更 合理 的 偏好 。 基 于 同样 的 原理 ，McCarthy 等 提出 要 
通过 解释 为 什么 会 有 这 些 产品 来 帮助 用 户 知道 有 关 产 品 的 知识 ， 而 不 是 为 解释 系统 为 什么 没 
能 找到 满意 结果 而 找 借 口 L31]。FinaMe 系统 基于 产品 类 型 的 背景 知识 ， 在 更 高 层次 上 [8，9] 
解释 了 偏好 集 为 什么 会 冲突 。 当 用 户 想 要 低 耗 能 和 高 动力 汽车 时 ，FinaMe 系统 将 会 说 明 这 
两 者 是 冲突 的 。 这 种 部 分 满足 的 解决 方式 在 Stolze 的 文献 [63] 中 也 被 称 为 软 导航 。 

为 了 让 用 户 相信 部 分 满足 的 结果 ， 我 们 需要 采用 类 似 于 activedecision. com 中 使 用 的 
方法 。 这 种 方法 里 ， 不 仅 展 示 了 部 分 满足 的 结果 ， 也 详细 解释 了 系统 为 什么 满足 这 些 用 户 
的 偏好 ， 而 不 是 另外 那些 。 基 于 一 系列 的 假设 和 相关 问题 ， 针 对 这 些 解 释 机 制 ， 我 们 采用 
精细 问卷 调查 的 形式 ， 制 订 了 一 项 定性 的 用 户 调查 。53 位 参与 者 完成 了 本 次 调查 ， 他 们 
中 的 绝 大 多 数 都 非常 同意 解释 机 制 可 以 更 好 地 激发 他 们 对 于 推荐 系统 的 信任 度 [10]。 另 
外 ， 有 一 项 替代 的 解释 技术 ， 与 传统 地 将 每 个 物品 用 一 种 解释 展现 相 比 ( 见 图 16. 2) ， 将 部 
分 满足 的 产品 分 组 到 不 同类 目 里 的 层次 界面 更 受 大 多 数 受 试 者 的 欢迎 [10]。 此 外 ， 还 有 一 
项 72 个 人 参与 的 用 户 研究 也 更 深层 次 地 证 明了 ， 界 面 的 方式 能 在 用 户 的 主观 感知 能 力 、 
再 次 访问 的 意愿 以 及 节省 代价 的 意愿 方面 显著 激励 那些 受 能 力 激发 的 用 户 的 信任 度 ( 详 情 
请 看 7. 3 节 的 实验 )[49]。 
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图 16.2 展示 部 分 满足 用 户 需 求 产 品 的 界面 
指导 准则 7: 在 解决 偏好 冲突 时 ， 可 以 通过 详细 解释 的 方式 ， 给 用 户 展示 部 分 匹配 的 结果 。 


16.6.2 权衡 辅助 


随 着 目录 规模 的 增长 ， 找 到 目标 物品 变 得 越 来 越 难 。 除 非 有 工具 帮助 用 户 有 效 地 查看 
和 比较 许多 潜在 有 趣 的 产品 ， 否 则 用 户 的 决策 精度 会 很 低 。 尽 管 推荐 系统 能 够 通过 过 滤 和 
比较 功能 提高 决策 质量 [20]， 但 是 用 户 仍然 要 面 对 如 何 选择 正确 物品 的 抉择 。 

我 们 团队 的 研究 人 员 发 现 ， 通 过 对 拥有 权衡 属性 的 选项 进行 对 比 的 方式 ， 可 以 将 决策 准 
确 率 提高 到 57%[48]。28 位 受 试 者 (10 位 女性 ) 参 与 了 本 次 实验 ， 每 位 参与 者 首先 得 做 出 一 
个 选择 ， 然 后 使 用 决策 辅助 工具 来 处 理 权衡 问题 。 结 果 证 明 ， 当 用 户 认 为 一 项 物品 是 最 终 目 
标 时 ， 推 荐 工具 可 以 通过 给 用 户 一 组 可 以 权衡 的 候选 项 来 得 到 更 高 的 决策 准确 度 。16. 5 节 提 
出 的 实例 评价 界面 ， 如 类 似 “ 我 喜欢 这 款 便携 式 电脑 ， 但 有 更 轻 的 吗 ?” 同 样 也 能 处 理 这 类 权 
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衡 问 题 ， 这 类 交互 风格 称 作 权衡 导航 ， 可 以 通过 类 似 “ 修 改组 件 或 “调整 面板 (如 [47] 的 图 
4) 来 解决 问题 。FindMe[8] 采 用 的 调整 技术 是 最 早 实现 这 种 权衡 辅助 的 工具 。 它 最 早 是 被 设 
计 用 来 通过 每 次 修改 用 户 已 经 表述 的 偏好 ， 帮 助 用 户 浏览 目标 。 实 例 评价 方法 (SmartClient 
[48，47]) 其 实 更 适合 处 理 这 类 权衡 问题 ， 特 别 是 两 项 属性 的 冲突 。 在 单 次 交互 中 用 户 可 以 
陈述 他 们 的 想法 ， 提 高 某 个 属性 值 ， 在 其 他 属性 上 做 出 让 步 ， 或 者 两 者 丝 有 。 

Reilly 等 引入 了 使 用 动态 评价 的 方法 来 处 理 这 类 权衡 问题 L53]。 为 了 达到 改善 系统 推 
荐 准确 率 的 目的 ， 评价 是 在 用 户 可 以 选择 的 属性 级 别 上 的 直接 反馈 。 例 如 ， 系 统 在 推荐 一 
款 佳能 数码 相机 后 ， 可 以 给 出 提示 :“ 更 丰富 的 匹配 : 1) 更 低 的 光学 变焦 但 是 机 身 更 薄 更 
轻 的 产品 ; 2) 其 他 厂商 像素 更 低 但 是 更 便宜 的 产品 ; 3) 更 大 的 镜头 尺寸 和 更 大 内 存 但 是 更 
重 ,” 动 态 评价 是 自动 产生 有 用 的 评价 组 合 的 过 程 ， 从 而 用 户 可 以 同时 指出 其 在 多 项 属性 上 
的 偏好 。 有 实验 表明 [53]， 与 单个 评价 相 比 ， 动 态 评价 可 以 减少 高 达 40% 的 交互 周期 。 

尽管 初始 时 被 设计 用 来 解决 推荐 系统 的 导航 问题 ， 文 献 L[53] 描 述 的 单个 评价 和 组 合 评 
价 相当 于 文献 L47] 定 义 的 简单 权衡 和 复杂 权衡 。 这 两 项 机 制 都 可 以 帮助 用 户 在 一 组 权衡 候 
选集 中 比较 和 评估 被 推荐 的 物品 。 然 而 ， 动 态 评价 方法 提供 的 是 系统 提议 的 权衡 支持 ， 这 
是 因为 系统 在 生成 和 建议 权衡 的 类 别 ， 而 实例 评价 提供 给 用 户 一 种 机 制 ， 能 够 初始 化 他 们 
自己 的 权衡 体验 (在 文献 L11] 中 被 称 为 用 户 激发 的 评价 ) 。 

我 们 团队 最 近 对 比 了 用 户 激励 和 系统 提议 两 种 方法 的 效果 [11]， 有 36 位 志愿 者 (5 位 
女性 ) 参 与 了 这 项 实验 。 实 验 中 由 受 试 者 参与 设计 项 目 ， 每 位 参与 者 都 被 要 求 分 别 评估 对 
应 了 两 种 方法 的 两 个 界面 。 评 估 时 用 到 了 2. 2 节 描 述 的 所 有 三 种 评估 标准 : 决策 准确 率 、 
用 户 交互 代价 和 用 户 信任 度 。 实 验 结果 表明 ， 用 户 激励 的 权衡 方法 更 能 提高 决策 准确 率 和 
减少 相对 的 代价 ， 这 主要 是 因为 它 更 灵活 ， 允 许 用 户 自由 地 设置 单个 和 组 合 评价 方式 。 另 
外 ， 用 户 激励 的 评价 方法 的 信任 度 也 更 高 ， 因 为 这 提高 了 用 户 购买 他 们 自己 寻找 到 的 产品 
的 意愿 ， 以 后 也 将 会 继续 使 用 系统 。 因 此 我 们 提出 : 

指导 准则 8: 除了 提供 检索 功能 ， 还 需要 在 界面 上 为 用 户 提供 权衡 辅助 ， 可 以 是 系统 
提议 或 是 用 户 激励 的 方式 。 后 者 更 灵活 ， 也 能 得 到 更 高 的 决策 准确 率 和 用 户 信 任 度 。 


16.7 展示 策略 


基于 偏好 的 推荐 系统 至 少 使 用 了 以 下 三 种 展示 策略 : 一 次 推荐 一 项 物品 ， 展 示 kkf 
于 3 和 30 之 间 ) 项 最 匹配 的 结果 ， 或 是 通过 分 值 解释 的 方式 展示 产品 。 我 们 将 用 ACE HE 
架 来 讨论 这 些 策略 的 区 别 。 


16.7.1 一 次 推荐 一 项 物品 


这 类 推荐 系统 的 优点 在 于 ， 它 设计 相对 简单 ， 用 户 也 不 大 可 能 对 过 剩 信息 感到 惊讶 ， 
并 且 界 面 也 适合 类 似 于 手机 这 类 较 小 的 展示 设备 ， 但 最 明显 的 缺点 是 用 户 可 能 不 能 快速 找 
到 他 们 的 目标 。16. 5 节 中 提 到 ， 新 用 户 的 初始 偏好 是 不 确定 的 ， 因 此 初始 的 推荐 结果 可 
能 没有 包含 他 们 的 目标 选择 。 并 且 ， 由 于 结果 集 小 ， 用 户 不 得 不 与 系统 进行 很 多 次 的 交 
Ha 或 是 在 还 没有 找到 目标 选择 前 ， 用 户 就 已 经 不 再 继续 ， 这 样 就 导致 了 更 低 的 决策 准确 
率 。 因 此 我 们 提出 : 

指导 准则 9， 一 次 展示 一 项 推荐 物品 ， 这 种 简单 策略 可 能 很 适合 用 于 小 型 展示 设备 ， 
但 是 ， 这 可 能 会 导致 更 长 的 交互 周期 或 是 得 到 相对 低 的 决策 准确 率 。 
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16.7.2 推荐 k 项 最 匹配 的 物品 


许多 产品 检索 工具 给 用 户 展示 了 前 项 最 匹配 的 结果 ， 这 被 称 为 项 最 匹配 界面 ， 如 
ActiveDecision. com 用 到 的 商业 工具 (之 10) ， 以 及 SmartClient(7<k<30), ATA (k=3)[28], 
ExpertClerk(&—3), FirstCase(& — 3)[37 ]fil TopCase (k= 二 3)[38]] 提 到 的 学 术 原 型 。 

当 & 接 近 10 的 时 候 ， 选 项 的 排序 问题 变 得 很 重要 ， 最 常见 的 方法 是 使 用 同一 个 评分 
方法 (多 属性 效用 理论 L24]j) ， 根 据 用 户 偏 好 匹配 度 对 & 项 匹配 结果 排序 。 我 们 同样 可 以 使 
M k 邻 域 检索 算法 (或 仅仅 kNN)L12j] 来 排序 ， 如 基于 案例 推理 领域 用 到 的 方法 [25]。 这 上 
个 物品 ， 是 从 高 到 低 ， 按 分 值 降序 的 方式 排列 的 (activedecision. com, SmartClient), KR 
法 可 以 在 不 干扰 用 户 的 情况 下 ， 展 示 相 对 多 的 选项 ， 并 且 根 据 用 户 偏 好 匹配 程度 选择 ， 可 
以 得 到 相对 高 的 决策 准确 率 [48，47]。 

Pu fil Kumar 做 了 一 项 实验 ， 用 来 对 比 基 于 实例 评价 的 系统 (k= 二 7， 根 据 效 用 分 值 排 
序 ) 和 使 用 排序 列表 展示 方法 的 系统 (上 一 2”， 根 据 用 户 选 择 的 属性 值 排序 ， 如 价格 )[47， 
51]. 22 位 志愿 者 参与 本 次 实验 ， 每 位 志愿 者 都 需要 按照 给 定 任务 随机 顺序 的 方式 ， 来 试 
用 这 两 种 界面 。 结 果 表 明 ， 在 完成 这 些 指定 检索 任务 时 ， 实 例 评价 方法 操作 更 简单 (更 少 
的 完成 时 间 和 更 低 的 错误 率 ) ， 也 能 得 到 相对 高 的 决策 准确 率 [48，51]j， 更 多 的 人 相信 界 
面 的 排序 结果 是 正确 的 。 许 多 用 户 认 为 实例 评价 系统 (只 展示 7 个 物品 ) 隐 藏 了 部 分 结果 ， 
并 且 界 面 展示 的 与 实际 的 排序 不 一 致 。 从 这 项 实验 研究 中 可 以 观察 到 ， 用 户 通常 不 会 向 下 
滚动 查看 更 多 展示 的 产品 ， 但 他 们 的 信任 度 更 高 ， 而 且 交互 时 间 没 有 受到 影响 。 因 此 我 们 
为 项 最 匹配 展示 策略 提出 准则 : 

指导 准则 10. 通过 展示 更 多 的 产品 ， 并 对 其 进行 自然 排序 ， 有 可 能 提高 用 户 的 操控 感 
和 信任 度 。 


16.7.3 解释 界面 


提 到 建议 性 决策 时 ， 如 可 以 选择 购买 哪 款 相机 ， 建 立 用 户 对 系统 的 信任 度 并 相信 推荐 结 
果 ， 这 是 衡量 系统 是 否 成 功 的 关键 因素 。 我 们 团队 的 研究 者 ， 在 普通 用 户 和 系统 之 前 的 信任 
关系 中 ， 研 究 了 用 户 信任 度 和 其 他 主观 因素 。 众 所 周知 ， 人 们 对 于 科技 产物 (如 推荐 系统 ) 的 
信任 ， 也 可 以 抽象 出 像 能 力 、 善 意 和 诚实 这 些 概念 ， 这 与 人 人 之 间 的 信任 状况 是 类 似 的 。 并 
且 ， 信 任 是 用 户 与 系统 间 的 一 项 长 久 的 关系 
[10]。 如 果 用 户 信任 一 个 推荐 系统 ， 她 更 可 
能 会 购买 推荐 物品 ， 并 且 将 会 再 次 光临 。 在 
一 项 有 53 名 用 户 参 与 的 精心 设计 的 定性 调 
研 揭示 ， 信 任 关 系 的 构建 才 是 界面 解释 其 结 
果 的 重要 能 力 L10]， 见 6. 1 节 。 

解释 界面 有 很 多 种 实现 方式 。 如 Ac- 
tiveDecision. com 在 结果 展示 界面 上 添加 了 
一 个 “Why” 标 签 ， 在 鼠标 悬浮 在 上 面 时 将 会 
看 到 提示 ， 解 释 了 为 什么 该 项 物品 匹配 了 用 
户 的 偏好 ， 类 似 图 16. 3 展示 的 界面 。 另 一 
方面 ， 也 可 以 设计 基于 组 织 结构 的 解释 界 
面 ， 将 最 匹配 选项 展示 在 最 上 面 ， 并 提供 了 图 16.3 典型 的 带 有 “Why” 标 签 的 推荐 系统 界面 


$1'379.00 
$1'179,00 
$1'529.00 
1529.00 
$1'425.00 
$2285.00 . 
$1190.00 
$1125.00 
$2'319,00 
$149900 
$1739.99 
152900 
$1'625,99 
$1426.99 


BEEEE 


o 
o 
o 
o 
o 
o 
o 
o 
o 
© 
o 
o 
e 
o 


EREEEEE? 





356 ”第 三 部 分 推荐 系统 的 影响 


权衡 候选 项 的 多 个 类 别 [49]。 每 个 带 标签 表示 的 类 别 都 标 上 了 标题 ， 解 释 了 为 什么 物品 会 
出 现在 这 些 类 别 ， 如 图 16. 4 所 示 。 


Processor Speed Battery lite Installed memory Hard drive capacity Display size Weight 
1.6? GHz 45 hour(s) 512 MB 80 GB 38.6 dm 254kg 


Processor speed Installed memory Harddrive capacity — Display site Weight 
15 GHz 512 MB 
15 GHa 51288 
1.5 GHz 512 MB 
156H: 512 MB 
1.2GHz 512 M8 


Installed memory 


Hard drive capacty Display sire 
33,8 un 
33.8 em 
30.7 an 
259 im 
26.9 cm 
30,7 qn 


Processor speed Installed memory Hard drive caparity Oliplay size 
3.2 GHz 512 MB 60GB 39.1 m 
166Hr $12 MB 80 GR /39.1 m 
3.2 GHz 512 M8 39.1«m 
ied 58 hous) size 26.1 on 
1.6 GHz 15 hour(s) 256 MB 38.1 m 
1.13 Ghz 35 hours) 120 MB 33.8 «n 





图 16.4 更 具有 激励 作用 结构 化 界面 


一 项 实验 研究 ， 在 对 比 了 传统 Why” 标签 方式 的 效果 的 情况 下 ， 探 究 了 类 别 组 织 结构 
的 界面 ， 是 否 是 更 有 效 的 解释 推荐 结果 的 方式 。 为 了 和 弄 清楚 有 组 织 结构 的 界面 是 否 是 解释 
推荐 结果 更 有 效 的 方法 ， 由 受 试 者 参与 设计 的 一 项 大 规模 实验 研究 ， 将 有 组 织 结构 的 界面 
和 传统 的 “为 什么 ”进行 了 对 比 。72 位 志愿 者 (19 位 女性 ) 参 与 了 这 项 用 户 研 究 。 结 果 证 明 ， 
有 组 织 结构 的 界面 可 以 显著 提高 用 户 对 系统 能 力 的 感知 度 ， 从 而 能 更 有 效 地 提高 用 户 信 任 
度 ， 也 能 增强 其 减少 代价 的 意愿 ， 并 会 再 次 使 用 该 界面 [49]。 另 外 ， 研 究 发 现 ， 查 找 产品 
消耗 的 时 间 长 短 并 不 会 显著 影响 用 户 的 主观 感觉 。 也 就 是 说 ， 在 界面 上 花 的 时 间 少 ， 虽 然 
对 于 降低 决策 代价 很 重要 ， 但 不 能 单独 用 来 预测 用 户 的 主观 感受 。 文 献 [49] 提 出 了 高 效 设 
计 有 组 织 结构 的 界面 的 5 项 准则 和 生成 这 种 界面 内 容 的 算法 。 在 此 我 们 提出 : 

指导 准则 11; 设计 界面 时 ， 如 果 对 评分 排序 的 计算 过 程 给 出 相应 解释 ， 将 更 能 提高 用 
户 的 信任 度 。 
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16.8 ”准则 验证 模型 


我 们 提出 了 一 系列 指导 准则 ， 来 保证 在 设计 产品 检索 工具 时 ， 可 以 依赖 基于 以 下 三 项 
关键 标准 的 普 适 框架 : DAREAK; 2) 用 户 交互 代价 ; 3) 用 户 决策 信任 度 。 接 下 来 ， 我 
们 需要 根据 用 户 行为 理论 ， 来 验证 这 些 准则 是 否 能 够 优化 推荐 系统 的 性 能 。 首 先 ， 我 们 认 
为 产品 检索 工具 必须 能 够 满足 大 众 用 户 需 要 ， 它 必须 能 够 适应 多 种 多 样 的 用 户 ， 特 别 是 那 
些 为 了 得 到 渴望 结果 ， 持 续 地 与 系统 进行 交互 的 用 户 。 在 我 们 的 理论 模型 中 ， 使 用 e 指 代 
用 户 的 交互 代价 ， 由 交互 步骤 来 度量 。 在 同样 的 代价 下 ， 如 果 用 户 能 够 每 次 都 得 到 最 匹配 
的 选项 ， 那 么 用 户 将 会 对 系统 拥有 越 来 越 高 的 信任 度 。 我 们 将 用 户 认为 系统 能 够 达到 的 信 
任 度 ， 称 为 感知 准确 率 a。 

由 于 每 个 用 户 可 能 会 有 不 同 的 代价 和 感知 准确 率 需求 ， 我 们 可 以 对 用 户 抽象 出 三 项 
BR: 

。 fa TEBE RAE 0: 用 户 满 意 搜索 过 程 的 当前 结果 并 买 下 产品 所 需 的 感知 准确 率 的 

数量 。 

。 AGT ce: 用 户 为 了 获得 推荐 结果 所 需要 的 代价 。 

。 代价 增 量 闵 值 $: 额外 的 感知 准确 率 ， 用 来 激励 用 户 投入 额外 的 交互 循环 。 

一 个 设计 很 差 的 工具 ， 可 能 会 因为 缺乏 足够 信任 度 ， 或 在 调整 交互 代价 后 信任 度 增值 
太 少 ， 从 而 失去 用 户 。 图 16. 5 展示 了 各 个 推荐 系统 中 各 个 步骤 的 感知 准确 率 ， 信 任 度 阔 
值 用 水 平 的 虚线 表示 ， 如 果 感 知 准确 率 未 能 超过 这 项 阔 值 ， 用 户 将 不 会 购买 产品 。 代 价 阔 
fie 和 代价 增 量 阔 值 $， 可 以 表示 用 户 能 够 承受 的 总 代价 。 在 图 16.5 中 ， 用 标识 “代价 界 
限 ” 的 斜 虚线 表示 ， 当 准确 率 / 代 价 的 值 小 于 代价 界限 时 ， 用 户 将 会 放弃 整个 交互 过 程 。 


感知 
准确 率 a 





信任 度 
BHEO 









se 
不 接受 推荐 结果 


TR 


1 2 3 4 5 6 7 8 9 * 10 11 12 
代价 阔 值 
a) 初始 偏好 b) 修正 偏好 b) 修正 偏好 


图 16.5 感知 准确 率 与 交互 代价 的 关系 函数 


图 16. 5 中 使 用 了 一 个 工具 ， 使 得 用 户 可 以 在 包含 一 系列 问题 的 对 话 框 中 设置 其 自身 
偏好 。 很 明显 ， 这 种 界面 需要 在 未 能 展示 任何 结果 之 前 ， 消 耗 偏好 提取 代价 ， 这 种 界面 需 
要 在 展示 结果 之 前 付出 很 大 的 代价 提取 用 户 的 偏好 ， 因 此 用 户 的 感知 准确 率 会 很 低 ， 直 到 
用 户 得 到 第 一 批 展示 结果 。 紧 接着 ， 通 过 偏好 修正 过 程 ， 用 户 能 够 逐步 得 到 更 高 的 感知 准 
确 率 。 这 种 情况 下 ， 当 达到 信任 度 阔 值 时 ， 交 互 过 程 仍然 未 能 给 出 满意 的 结果 ， 用 户 将 中 
断 整个 推荐 过 程 。 如 果 用 户 有 更 多 的 耐心 ， 他 们 训 以 在 超过 信任 度 冰 值 和 可 接受 的 代价 下 
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得 到 理想 结果 ， 此 时 曲线 到 达 的 代价 界限 值 ， 是 其 与 “代价 界限 ”的 第 三 次 交点 。 然 而 ， 这 
种 情况 对 用 户 来 说 不 那么 显而易见 ， 因 此 很 难 达 到 这 个 点 。 在 那些 不 关注 每 次 代价 增加 后 
能 显著 提升 感知 准确 率 的 界面 设计 中 ， 也 将 会 出 现 这 类 问题 。 

为 了 解决 这 一 缺陷 ， 推 荐 工具 认为 感知 概率 与 代价 关系 函数 是 一 个 止 函数 ， 如 图 16. 6 
所 示 。 这 个 函数 利用 用 户 的 代价 阔 值 达到 了 最 佳 程度 : 如 果 感 知 准确 率 的 增加 不 足以 吸引 
用 户 继续 使 用 该 工具 ， 用 户 将 不 再 与 系统 进行 交互 。 

只 有 保证 对 用 户 的 操作 即时 反馈 ， 并 且 在 交互 的 早期 就 采取 措施 在 感知 准确 率 上 得 到 
快速 增加 ， 才 能 实现 上 面 所 说 的 止 函 数 。 早 期 感知 准确 率 的 增加 ， 如 图 16. 6 中 的 虚线 所 
示 ， 可 以 让 用 户 在 系统 中 交互 更 长 的 时 间 。 基 于 实例 的 交互 和 强调 以 结构 化 及 激发 信任 的 
方法 展示 多 种 方案 的 第 9、10、11 条 通用 准则 ， 保 证 了 即时 反馈 。 一 般 情况 下 ， 可 以 假设 
用 户 自己 会 选择 增加 他 们 认为 能 够 最 大 化 决策 精度 的 信息 ， 因 此 用 户 的 意愿 是 实现 该 止 函 
数 的 关键 。 阶 段 a， 系 统 通过 充分 挖掘 用 户 的 偏好 ， 可 以 达到 最 高 的 准确 率 。 但 这 个 阶段 
中 ， 如 何 避 免 让 用 户 回答 那些 不 能 准确 回答 的 问题 ， 是 很 重要 的 (指导 准则 D. x5. A 
户 陈述 初始 偏好 时 花费 的 代价 越 少 ， 这 个 凹 函 数 曲 线 将 变 得 越 陡 ， 因 此 我 们 得 使 用 指导 准 
则 2 和 3。 

感知 — 
mE art j 





信任 度 | p ol sc. 2 E jJ 
Moh aes pred 





[aes 6 7 6 9393 
代价 阅 值 
a) 初始 偏好 b) 修正 偏好 b 修正 偏好 


1. 任何 代价 ; 4. 展示 实例 选项 ; 7. 偏好 冲突 管理 ; 
2. 任何 排序 ; 5. 展示 多 样 实例 ; 8. 权衡 辅助 。 
3. 任何 偏好 。 6. 采用 预见 的 原则 


推荐 选项 。 


a) ~c) 的 准则 

9. 一 次 展现 一 个 搜索 结果 适合 小 屏幕 设备 ， 但 决策 准确 率 会 低 ; 

10. 展示 更 多 的 产品 并 按照 自然 排序 ， 有 可 能 提高 用 户 的 操控 感 和 信任 度 ; 

11. 设计 界面 时 ， 如 果 对 评分 排序 的 计算 过 程 给 出 相应 解释 ， 将 更 能 提高 
用 户 的 信任 度 。 





图 16.6 基于 示例 推荐 系统 中 ， 感 知 准确 率 与 交互 代价 的 关系 ， 以 及 相应 的 实现 指导 准则 


一 旦 获得 初始 偏好 后 ， 阶 段 b 中 ， 通 过 让 用 户 完成 那些 初始 未 能 意识 到 的 偏好 ， 可 以 
得 到 此 阶段 最 高 的 感知 准确 率 。 可 以 通过 实例 激励 (指导 准则 4) 和 让 用 户 更 了 解 当前 选项 
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(指导 准则 5 和 6) 实现 ， 也 解决 了 这 一 交互 阶段 的 代价 和 效果 的 主要 冲突 。 最 后 ， 阶 段 c 
中 ， 通 过 调整 偏好 的 权重 以 及 做 出 相应 的 权衡 ， 能 对 偏好 集 进行 微调 ， 可 以 使 用 部 分 匹配 
方案 (指导 准则 7) 和 动态 偏好 权衡 的 方案 (指导 准则 8) 。 

由 于 推荐 工具 不 能 保证 用 户 在 阶段 转换 时 (通常 是 梯度 的 转换 ) 的 效果 ， 需 要 在 每 个 阶 
段 提 供 持 续 的 支持 ， 并 且 鼓 励 能 提高 感知 准确 率 的 行为 。 因 此 ， 相 比 添 加 新 的 偏好 ， 权 重 
的 调整 可 以 不 那么 显著 。 | 

16. 5 节 中 描述 的 基于 实例 的 推荐 系统 能 更 好 地 解决 上 述 需求 ， 并 且 通 过 增加 和 细 化 
用 户 偏好 ， 能 提高 真实 的 决策 准确 率 。 为 了 保证 用 户 愿 意 投 入 整个 交互 过 程 中 并 且 愿 意 接 
受 检索 结果 ， 真 实 准 确 率 也 必须 能 够 被 用 户 所 感知 ， 可 以 使 用 多 次 展示 多 项 结果 (指导 准 
则 9) 的 方式 来 纠正 误差 ， 可 以 使 用 结构 化 展示 界面 (指导 准则 10) 以 及 结果 解释 (指导 准则 
11)， 这 些 都 是 激励 用 户 投 入 足够 的 代价 来 尽 可 能 得 到 更 高 实际 准确 率 的 基本 方法 。 


16.9 总 结 


本 章 提出 了 11 项 关键 的 指导 准则 ， 可 以 用 于 设计 基于 偏好 的 交互 式 推荐 系统 中 。 为 
了 更 好 地 展示 和 证 明 这 些 准 则 ， 我 们 从 深度 和 广度 的 角度 上 回顾 之 前 在 侧重 用 户 交互 的 实 
例 评价 方面 的 研究 工作 。 更 重要 的 是 ， 我 们 提出 了 基于 三 种 基本 评估 标准 的 框架 ， 这 三 种 
标准 包括 : 决策 准确 率 、 用 户 信 任 度 和 用 户 交 互 代 价 ( 简 称 ACE)。 在 该 框架 里 ,我 们 借 
鉴 了 已 被 实践 证 明 的 多 项 技术 ， 来 实现 上 述 11 项 指导 准则 ， 并 且 侧 重 三 种 标准 的 结果 平 
衡 。 通 过 使 用 这 些 准 则 ， 可 以 显著 加 强 产品 推荐 系统 的 可 用 性 ， 也 能 推广 电子 商务 系统 的 
应 用 。 
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17.1 简介 


传统 推荐 系统 通过 排 好 序 的 列表 向 用 户 进 行 推荐 。 例如， 在 基于 内 容 和 知识 的 推荐 系 
统 中 ， 这 些 列表 通常 根据 与 查询 、 理 想 产 品 规范 或 样本 产品 的 相似 度 进行 排序 。 然 而 ， 该 
方法 会 损失 大 量 信息 ， 因 为 对 同一 查询 具有 相同 相似 度 的 两 种 产品 可 能 在 另 一 套 完 全 不 同 
的 产品 特征 集 下 不 再 相同 。 使 用 基于 二 维 示 意图 的 推荐 可 视 化 能 够 记录 部 分 这 样 的 信息 ， 
从 而 把 彼此 相似 的 推荐 放 在 示意 图 中 的 同一 区 域 。 

基于 示意 图 的 方法 非常 有 用 的 一 个 领域 就 是 电子 商务 ， 因 为 电子 商务 商店 所 卖 的 大 量 
产品 通常 由 大 量 的 特征 所 描述 ， 但 对 某 些 产品 类 ， 这 些 特征 很 容易 通过 产品 的 图 片 识别 。 
该 方法 适用 的 电子 商务 领域 有 电子 消费 产品 和 不 动产 产品 。 最 近 业 内 有 人 尝试 用 可 视 化 购 
物 的 方法 来 提升 这 一 类 网 站 的 可 用 性 。CrispyShop. com。 就 是 其 中 一 例 ， 它 使 用 图 表 来 比 
较 产 品 的 特征 和 价格 。 另 一 个 可 视 化 购物 的 方法 是 根据 视觉 相似 度 ( 如 颜色 和 形状 ) 来 选择 
产品 ， 就 像 Like. com^ fll Modistas 做 的 那样 ， 这 在 时 尚 相关 领域 特别 有 效 。 一 种 与 基于 
示意 图 的 方法 更 紧密 相关 的 方法 已 经 被 BrowseGoods. com 采用 了 ， 它 将 产品 用 类 似 于 百 
货 商店 的 排序 方法 进行 排序 并 展示 在 图 中 。Mnusicovery 旦 和 LivePlasma® 都 展示 了 一 种 歌 
曲 示 意图 ， 之 后 他 们 又 创建 了 类 似 的 电影 示意 图 。 最 后 ，Youtube® 有 一 个 称 为 Warp! 的 
想法 ， 推 荐 和 你 观看 过 的 电影 相似 的 电影 ， 并 把 它们 展示 在 图 中 。 

尽管 有 大 量 的 基于 商业 示意 图 的 界面 ， 它 们 却 缺 少 一 个 公开 可 用 的 、 科 学 的 基础 。 在 
本 章 ， 我 们 将 讨论 产品 目录 图 界面 中 的 一 些 问题 ， 这 些 问 题 早期 发 表 在 L21，22，23， 
24]j。 本 章 结合 了 这 些 问 题 并 展示 一 些 在 真实 电子 商务 产品 目录 上 的 应 用 。 

在 17. 2 节 中 ， 我 们 首先 回顾 一 些 电 子 商 务 领 域 或 相关 领域 用 来 创建 这 些 图 的 科学 方 
法 。 其 中 两 种 ， 多 维 缩放 (MDS) 和 非 线 性 主 成 分 分 析 (NL-PCA)[13，31，34j 在 17.3 节 
中 会 进行 详细 的 探讨 ， 它 们 通过 两 种 不 同 的 方式 来 创建 产品 目录 图 界面 。 第 一 种 基于 
MDS 的 方法 使 用 灵活 的 相 异 度 指标 [21]。 第 二 种 基于 NL-PCA 的 方法 [24] 显 示 了 可 用 于 
图 导航 的 表示 分 类 属性 值 (分 类 属性 的 可 能 值 ) 的 点 。 
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所 有 基于 图 的 可 视 化 和 基于 物品 的 推荐 中 的 一 个 共同 问题 是 : 不 同 的 产品 特征 对 用 户 来 
说 并 不 同等 重要 。 在 17.4 节 中 ， 我 们 介绍 一 种 使 用 点 击 流 数据 来 决定 属性 权重 的 方法 。 我 
们 统计 产品 被 卖 出 的 频繁 程度 。 基 于 这 样 一 种 假设 : 对 销量 影响 大 的 属性 在 用 户 看 来 就 更 重 
要 ， 我 们 估算 了 一 个 泊 松 回归 模型 [32，35] 来 得 到 权重 。 对 该 方法 的 描述 见 文献 L[22] 。 

在 17. 5 节 中 ， 我 们 描述 了 一 种 可 将 基于 图 的 可 视 化 和 推荐 系统 相 结合 的 方法 。 该 方 
法 结合 了 MDS 和 文献 [45j 中 的 推荐 思想 。 在 每 一 步 迭代 过 程 中 ， 我 们 将 包含 有 限 个 产品 _ 
的 图 展示 给 用 户 ， 用 户 从 中 挑选 最 喜欢 的 一 个 产品 。 接 着 在 下 一 步 中 ， 我 们 展示 和 该 被 选 
产品 更 相似 的 产品 。 对 该 推荐 系统 方法 的 介绍 在 文献 L[23] 。 | 

在 17.6 节 中 ， 所 有 上 述 方法 都 被 用 于 一 个 全 新 真实 的 MP3 产品 目录 。 该 方法 的 原型 
可 从 http://www. browsingmap. com/mapvis. html 获得 。 该 产品 目录 由 Dutch 比价 网 
http://www. vergelijk. nl 下 的 Compare Group 提供 。 最 后 ， 在 17.7 节 中 ， 我 们 进行 总 
结 ， 并 给 出 了 未 来 研究 方向 。 


17.2 基于 图 的 可 视 化 方法 


基于 图 的 方法 在 用 户 需 要 浏览 较 大 数据 集 的 领域 中 越 来 越 流 行 ， 此 方法 中 的 相似 项 目 
聚 在 图 的 相同 区 域内 ， 如 网 络 搜索 、 图 像 浏 览 和 音乐 推荐 列表 管理 。 同 样 ， 基 于 图 的 可 视 
化 符合 业内 可 视 化 购物 界面 的 趋势 。 在 这 一 节 ， 我 们 讨论 上 述 领域 中 的 4 种 基于 图 的 可 视 
化 科学 方法 ， 并 重点 关注 用 于 浏览 产品 目录 的 可 视 化 方法 及 其 优 缺点 。 在 讨论 中 ， 我 们 特 
别 关注 (商业 ) 产 品目 录 中 通常 包含 的 数据 类 型 。 这 些 目录 通常 包含 数值 属性 、 类 别 属 性 和 
多 值 的 类 别 属性 。 另 外 ， 数 据 中 可 能 存在 大 量 缺失 值 ， 例 如 ， 不 同 厂商 给 出 的 不 同 产品 说 
明 所 造成 的 。 注 意 ， 一 些 可 视 化 方法 也 能 用 于 三 维 可 视 化 ， 但 考虑 到 3D 可 视 化 对 用 户 过 
于 复杂 ， 我 们 只 讨论 2D 可 视 化 。 

为 了 更 深刻 理解 我 们 要 讨论 的 4 种 可 视 化 方法 之 间 的 差别 ， 我 们 将 它们 应 用 在 了 一 个 
小 的 产品 目录 中 。 如 表 17. 1 所 示 ， 我 们 从 随后 将 要 用 到 的 MP3 播放 器 目录 中 ， 选 取 了 流 
ÍTR 10 个 组 成 该 产品 目录 ; 此 外 ， 为 了 算法 能 更 容易 地 执行 ， 我 们 限定 属性 数 为 4 且 属 
性 值 都 为 数值 的 或 二 元 的 ; 同时 ， 我 们 选择 在 4 种 产品 属性 没有 缺失 值 的 产品 。 


17.1 示例 数据 集 


2. Apple iPod Video(30GB) 130. 0 
3. Apple iPod Video(60GB) | 73.50 | 1 | 6 — | 156.0 
4. Apple iPod Video(80GB) | 320 | 1 | æ ) | 150 
5. Apple iPod Shuffle | 7.0 | o | | 1 | | 15.5 
6. Creative Zen Nano Plus | æo | o | 1 | 22.0 
7. Creative Zen Vision M(30GB) | 19.50 | 1 | 3 — | 163.0 
8. Creative Zen Vision M(60GB) | 2050 | 1 | 6  — | 178.0 
9. Sandisk Sansa e280 | x9 | o0 | -* 8: — '| 75.2 


17.2.1 自 组 织 上 映射 
在 网 络 ( 搜 索 ) 可 视 化 领域 中 ，Kohonen ff Ej £8 Z1 BR 8] (SOMD[27, 28, 29] 是 创建 图 
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方法 中 最 流行 的 一 种 。 跟 随 Chen 等 早期 的 工作 [5]，Chung 等 [6，7] 和 Yang 等 [50] 将 
SOM 用 于 实际 应 用 。Ong 等 [36] 使 用 SOM 创建 了 用 于 在 线 新 闻 的 示意 图 ，Van Gulik 等 
将 其 用 于 MP3 播放 器 的 音乐 采集 。 

自 组 织 图 使 用 非 监督 神经 网 络 同时 进行 聚 类 和 降 维 。 首 先 ， 需 要 选择 一 个 表示 图 结构 
的 网 格 ， 通 常 是 一 个 矩形 或 者 六 角 网 格 。SOM 训练 过 程 简 略 地 以 如 下 方式 运行 : 所 有 的 
网 格 点 (在 SOM 文献 中 通常 称 为 模型 、 权 重 或 者 原型 向 量 ) 根 据 它 们 在 网 格 中 的 位 置 和 原 
始 属性 空间 中 的 向 量 来 进行 初始 化 。 

接着 ， 通 过 增 量 学 习 方 法 ， 物 品 被 随机 地 输入 SOM。 对 于 一 个 物品 ， 我 们 首先 计算 
哪 一 个 模型 能 最 好 地 表示 这 个 物品 。 该 模型 称 作 胜利 者 或 者 最 佳 匹配 单元 (BMU)， 通 常 
使 用 欧 氏 距离 来 确定 。 然 后 ， 对 该 模型 及 其 邻居 进行 小 程度 的 调整 以 适应 该 物品 。 对 所 有 
的 物品 进行 如 上 操作 后 ， 该 迭代 结束 ， 下 一 次 迭代 开始 。 在 每 次 和 迭代 中 ， 已 有 的 物品 只 会 
受到 模型 (网 格 点 ) 及 其 邻居 较 小 的 影响 ， 以 便 SOM 收敛 到 一 个 解 。 一 种 更 快 的 SOM 批 
次 学 习 算法 见 文献 [29] 。 

SOM 的 主要 优点 是 它 通常 能 提供 聚 类 效果 很 好 的 图 ， 其 中 的 复 由 和 物品 相连 的 邻居 
网 格 点 集 以 及 相对 较 多 的 空 网 格 点 组 成 。 此 外 ， 在 图 中 ， 彼 此 相似 的 邻居 模型 提供 了 相似 
度 解释 。 然 而 ， 该 相似 度 解释 对 整个 图 并 不 总 是 有 效 。 尽 管 邻居 模型 通常 更 相似 ， 但 也 有 
可 能 在 图 的 另 一 块 中 存在 着 更 相似 的 模型 。 l 

另 一 个 缺点 是 ， 当 两 个 物品 被 分 配 到 同一 个 网 格 点 (模型 ) 中 时 ， 它 们 在 图 上 的 同一 个 
位 置 。 虽 然 可 以 指定 更 大 的 网 格 或 者 使 用 分 层 SOM( 对 每 一 个 原始 SOM 中 的 模型 创 一 个 


SOMD) 来 克服 。 而 且 ， 原 始 SOM 不 能 处 理 
缺失 值 或 者 (多 值 ) 分 类 属性 ， 但 是 通过 调整 PSM | RN | | | | RM 
比较 指标 来 确定 BMU 仍 是 可 行 的 [28]。 Muda sposi dfc dede spa 
图 17. 1 为 一 个 基于 表 17. 1 中 样本 产品 | | | | | segoj | | 
目录 的 10X10 的 矩形 网 格 SOM, 它 使 有 了 | | | | | | | tf 14 
Matlab[1] 中 的 SOM 工具 箱 进行 创建 。 如 ado | | | | | | .| | | 
图 ， 每 个 产品 都 被 分 配 到 方块 (网 格 点 ) 中 的 nei 
一 个 。 整 个 图 都 被 使 用 到 ， 即 每 一 个 转角 都 -a 
有 一 个 产品 被 分 配 到 上 面 ， 但 似乎 不 是 真实 EIE 
的 产品 聚 类 。 观 察 图 中 产品 的 顺序 ， 垂 直 维 人 | 这 | 本 
dviago 0] | |zenbisioheo| [iPod viag 


度 明 显 地 对 应 于 内 存 大 小 和 MP3 播放 器 是 
否 有 硬盘 驱动 。 水 平 维度 捕获 另外 两 种 属 Po 

性 。 但 是 因为 SOM 的 非 线 性 特征 ， 这 些 效 ”图 17.1 对 表 17.1 的 样本 产品 目录 的 自 组 织 映 
果 并 没有 在 整个 图 中 显示 出 一 致 性 。 射 示例 


17.2.2 树 图 


另 一 种 用 于 网 络 搜索 结果 可 视 化 [48] 和 商业 应 用 NewMap 的 新 闻 可 视 化 (截图 见 
第 15 章 ) 的 常用 方法 叫 作 树 图 算法 [44] 。 

树 图 使 用 一 棵 树 ， 例 如 ， 从 分 层 聚 类 获得 的 结果 作为 其 输入 。 每 个 叶子 节点 表示 一 个 
单独 的 物品 。 树 中 的 所 有 节点 都 标 有 权 值 。 对 于 非 叶子 节点 ， 其 权 值 为 所 有 子 节 点 权 值 之 
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和 。 当 所 有 叶子 节点 被 赋予 权 值 1 时 ， 所 有 节点 的 权 值 之 和 便 表 示 聚 类 大 小 。 物 品 也 可 以 
通过 一 些 流行 度 指标 进行 标记 ， 以 便 使 其 在 可 视 化 中 更 为 重要 。 

从 根 节点 开始 ， 我 们 按照 根 的 子 节点 个 数 垂直 地 将 图 划分 为 许多 部 分 ， 分隔 出 的 结果 
和 矩形 大 小 和 子 节点 的 权 值 有 关 。 接 着 ， 我 们 使 用 相应 节点 的 子 节点 进一步 进行 水 平 划分 。 
交替 进行 垂直 和 水 平 划 分 ， 直 到 触 碰 到 树 底 并 且 每 个 物品 在 图 上 都 有 一 个 大 小 与 权 值 相关 
的 矩形 。 

树 图 的 一 个 主要 优点 是 整个 图 都 被 填充 了 。 图 上 没有 不 含 任 何 物品 的 空间 ， 也 没有 物 
品 间 的 重 每。 另外 ， 它 的 分 层 结构 对 实现 缩放 功能 非常 有 用 。 因 为 树 图 可 以 结合 指标 相似 
度 的 分 层 聚 类 算法 使 用 ， 非 常 灵活 。 可 以 选择 一 种 和 已 有 数据 集 最 匹配 的 相似 度 指 标 。 例 
如 ， 可 以 使 用 17. 2. 3 节 中 将 介绍 的 相 异 度 指标 来 可 视 化 产品 目录 ， 它 能 够 处 理 缺 失 值 和 
混合 属性 类 型 。 

树 图 方法 有 两 个 缺点 。 首 先 ， 原 始 树 图 算法 经 常 针对 小 的 聚 类 和 单 物品 产生 大 的 方 
块 ， 使 得 单产 品类 别 的 可 视 化 很 难 。 该 问题 可 以 被 正方 形 化 树 图 [4] 或 者 更 好 的 定量 树 图 
部 分 解决 [23]， 后 者 确保 代表 物品 的 矩阵 有 一 个 确定 的 长 宽 比 例 。 第 二 个 缺点 是 ， 虽 然 相 
似 的 产品 被 聚 类 在 一 起 ， 但 仍 没 有 清楚 的 距离 解释 并 且 猎 间 的 顺序 可 能 丢失 ， 即 两 个 十 分 
相似 的 产品 被 分 配给 不 同 复 时 ， 它 们 在 图 上 可 能 并 不 近 。 


一 个 基于 表 17. 1 样本 产品 目录 的 树 图 如 
Video Vision 
80 60 







图 17. 2 所 示 。 为 了 创建 该 图 ， 我 们 首先 使 用 Mat- 
iPod Video 60 
Apple iPod Video 80GB 和 Creative Zen Vision， 
Apple iPOD Video60GB 更 靠近 于 Apple iPod Vide- 
典 缩放 [47] (Donaldson 的 用 于 可 视 化 音乐 播放 列表 的 算法 [11])、 非 度量 MDS 30], 
Sammon Mapping[42](Pecenovic 等 的 可 视 化 图 像 数 据 算法 [37]) 和 SMACOFL10](Stap- 


lab 基于 标准 化 欧 氏 距离 的 平均 连接 分 层 聚 类 算 
法 ， 并 使 用 Hicklin 所 写 的 基于 Matlab 的 树 图 算 
法 [18] 来 可 视 化 结果 树 。 在 图 上 ， 宽 线 表示 更 高 
的 数据 划分 ， 等 面积 的 矩阵 表示 产品 。SOM 顶部 

NW- 

A1200 
o30GB, Cretive Zen Vision M 30GB 和 Sony NW- | iPod Video 30 
Al1200( 因 为 从 Apple iPod Video 60GB 划分 Apple 
iPod Video 80GB 和 Creative Zen Vision M 60GB fj 图 17.2 对 表 17. 1 样本 产品 目录 的 树 图 示例 
线 比 下 面 的 线 更 宽 ) 。 
pers 等 的 可 视 化 滚 轴 滑冰 目录 [46])。 它 们 都 是 通过 在 低 维 欧 氏 空间 绘制 一 个 (对 称 ) 的 相 
AREAS E, CRAB FERET PATRI RU ER ST ERI. MDS 就 是 其 中 一 种 用 于 创建 产品 目录 
图 的 算法 ， 我 们 将 在 17. 2. 4 节 进 行 介绍 。 
MDS 的 主要 优点 是 ， 图 中 的 距离 真实 地 对 应 于 物品 间 的 相似 性 。 当 使 用 灵活 的 相 异 


的 产品 现在 到 了 树 图 的 右边 ， 这 些 产品 是 没有 
HDD 的 MP3 播放 器 。 在 左边 ， 我 们 发 现 相 对 于 
17.2.3 多 维 缩放 

第 三 类 应 用 使 用 多 维 缩放 算法 来 可 视 化 较 大 的 数据 集 。 已 有 大 量 的 MDS 算法 [3] 如 经 
度 指标 时 ，MDS 可 以 处 理 缺 失 值 和 混合 属性 类 。MDS 相对 于 SOM 和 TreeMap 的 缺点 
是 ， 有 大 量 的 空白 空间 存在 于 图 或 图 周围 ， 使 得 图 上 相似 的 物品 可 能 会 相互 覆盖 。 空 白 空 
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间 是 一 种 不 足 ， 因 为 为 了 能 理想 地 使 用 图 ， 对 图 中 特殊 部 分 做 更 多 的 缩放 是 必要 的 。 

图 17. 3 为 一 个 使 用 样本 产品 目录 和 MDS 算法 的 示意 图 。 我 们 使 用 PROXSCAL 创建 
该 图 ， 这 在 使 用 了 SMACOF 算法 的 SPSS 
目录 下 是 可 行 的 L33]。 相 异 度 矩阵 通过 标 
谁 化 的 欧 氏 距离 进行 计算 。 如 期 望 的 那 *iPod Video 80 
样 ， 相 对 于 SOM， 图 的 角落 更 空 但 图 上 产 


品 间 的 位 置 并 没有 太 大 变化 。MDS 配置 .iPod Video 30 

能 更 好 地 匹配 相 异 度 ， 但 另 一 方面 ， 它 使 “Zen Vision 60 — 
得 图 更 缺乏 组 织 。 注 意 ， 在 大 多 数 情况 下 *Zen Vision 30 

二 维 里 不 可 能 完美 地 匹配 所 有 相 异 度 ， 因 * NW-A1200 
此 这 种 让 部 分 相 异 度 更 好 的 解决 方法 只 是 


一 种 折 中 。 *iPod Video 60 


17.2.4 非 线 性 主 成 分 分 析 


主 成 分 分 析 (PCA) 也 许 是 用 于 降 维和 图 17.3 对 表 17. 1 中 展示 产品 目录 进行 多 维 缩放 得 
创建 图 最 著名 的 方法 。PCA 用 数值 型 数据 SUUS URDU 
矩阵 作为 输入 进行 线性 变化 ， 使 水 平 绘制 的 第 一 维 尽 可 能 多 地 代表 数据 中 的 变化 量 。 后 面 
的 维 (假设 只 有 二 维 ) 也 试 着 表示 剩余 的 变化 量 。 其 中 ， 两 两 维度 不 相关 。 非 线性 主 成 分 分 
析 (NL-PCA)[13，31，34] 相 对 于 PCA， 还 能 解决 分 类 属性 和 缺失 值 的 问题 。 通 过 序数 变 
换 ， 数 值 属 性 可 以 非 线性 转换 。 此 外 ， 在 图 上 属性 分 类 也 具有 了 一 个 位 置 ， 即 属于 分 类 的 
物品 集 的 中 心 。 这 些 分 类 点 既 可 用 于 解释 图 ， 也 可 以 在 图 的 界面 上 作为 一 种 导航 的 工具 ， 
就 像 我 们 的 产品 目录 图 采用 NL-PCA 所 做 的 那样 ， 这 将 会 在 17.2.5 节 中 介绍 。 

图 17. 4 展示 了 样本 产品 目录 的 NL-PCA 配置 ， 它 同样 使 用 了 SPSS 目录 下 的 CATP- 
CA 方法 [33]。 其 中 ， 所 有 的 数字 属性 都 被 当 作 序 数值 ， 使 得 非 线 性 转换 变 为 可 能 。 此 外 ， 
由 于 NLPCA 的 灵活 性 和 小 数据 集 ， 生 成 的 图 有 大 量 的 重 伙 产品。 事实 上 ，NL-PCA 创建 
了 非常 清晰 的 三 个 簇 。 虽 然 其 他 三 种 方法 产生 的 图 中 的 簇 也 比较 靠近 ， 但 它们 毕竟 没有 形 
成 真正 的 簇 。 该 例 说 明 ，NL-PCA 聚 类 产品 的 能 力 在 极端 情况 下 有 相同 的 分 类 值 。 
17. 3 产品 目录 图 Zen Vision 30 

*iPod Video 

本 节 介 绍 两 种 创建 产品 目录 的 示意 图 的 (Zen Vision 60 
方法 。 一 种 基于 多 维 缩放 的 产品 目录 图 ， 它 
结合 了 k-means 聚 类 算法 来 突出 一 些 原型 产 
品 ; 另 一 种 基于 非 线性 主 成 分 分 析 (NL- TNT 
PCA)， 它 利用 图 中 目录 点 来 提供 导航 机 制 。 | iPod Nano 
这 两 种 方法 早期 发 表 的 文章 见 [21] 和 [24]。 — |; seule 

我 们 在 该 方法 及 后 面 使 用 以 下 数学 符 
号 : 产品 目录 D 包含 I 个 产品 ， 产 品 i 包 含 
K 个 属性 x;= Ga Xs 5» Lx). RAN 


二 维 图 可 用 包含 图 中 产品 坐标 的 IX2 EZ 
描述 。 图 17.4 对 表 17.1 中 展示 产品 目录 进行 非 线 性 主 
成 分 分 析 得 到 的 示意 图 的 示例 





iPod Video 80 
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17.3.1 多 维 缩放 


我 们 描述 的 第 一 种 创建 产品 目录 图 的 方法 是 基于 MDS 的 。17. 2. 3 节 中 提 到 的 MDS 
图 的 基础 是 一 个 相 异 度 矩 阵 。 为 了 从 产品 目录 中 计算 相 异 度 和 矩阵 A， 我 们 需要 一 种 相 异 度 
评价 指标 。 该 指标 能 够 处 理 产品 目录 中 的 特殊 数据 ， 即 它 能 够 处 理 缺 失 值 、 数 值 的 、 分 类 
属性 和 多 值 分 类 属性 。 

很 多 流行 的 相似 ( 异 ) 度 指标 ， 如 欧 氏 距离 、 皮 尔 逊 相关 系数 以 及 Jaccard 相似 度 指标 ， 
不 能 够 处 理 所 有 上 述 属 性 类 。 并 且 ， 它 们 也 不 能 自然 地 处 理 缺 失 值 。 因 此 ， 我 们 使 用 相 蜡 
度 指标 作为 文献 [23] 中 Gower[14] 提 出 的 相似 度 系数 的 改版 。 请 注意 ， 基 于 MDS 的 产品 
目录 图 方法 也 能 够 使 用 其 他 相 异 度 指 标 ， 如 共同 购买 关系 或 者 物品 一 物品 关系 。 

产品 i 和 j 的 相 异 度 9 定义 为 非 缺 失 相 异 度 评分 在 天 个 属性 下 的 均值 的 平方 根 


K 
>) wy um 40 ji 
k=1 


S} wmam 

其 中 w 是 属性 & 的 权 值 ，m 和 mj 是 二 元 符号 ， 当 产品 i 或 j MRE RAM 
为 0， 反 之 为 1。 权 重 w 可 使 某 些 属性 更 重要 。17.4 节 中 ,我 们 将 展示 自动 地 分 配 这 些 
权 值 来 匹配 用 户 的 个 人 偏好 。 相 异 度 分 数 6; 基于 属性 & 的 类 ， 对 所 有 属性 类 ， 我 们 使 用 相 
同方 式 的 标准 化 来 保证 产品 目录 中 每 一 个 属性 的 平均 非 缺 失 相 异 度 分 数 等 于 1。 该 标准 化 
的 作用 是 使 相 异 度 分 数 同等 重要 并 且 独 立 于 缺失 值 数 。 


CIT I) 





数值 相 异 度 分 数 基于 绝对 距离 
| zx Xj | 
= SoHE ot (17. 2) 
(Pmama ) 2 mam; ng sty 
分 类 属性 相 异 度 分 数 
6% = aie Tta (17,3). - 


(Dmamn Y" 2 jmamalGs x Tj) 
其 中 1() 是 符号 函数 ， 当 条 件 成 立时 返回 1， 反 之 返回 0。 
为 了 处 理 一 个 产品 可 以 属于 多 个 分 类 的 分 类 属性 (多 值 分 类 属性 )， 相 异 度 框架 在 文 
献 [22] 中 被 扩展 。 对 多 值 分 类 属性 的 相 异 度 分 数 定义 为 
| xaAz a | 
p = -r i (17. 4) 
(Dimam) 2 mama (| zaAza |) 
其 中 z; 和 zi 是 值 集 ，A 是 对 称 差 集 操作 符 。 该 指标 统计 了 有 多 少 个 目录 包含 和 不 包 
会 一 个 产品 。 
17.2.3 节 提 到 的 MDS 方法 的 目标 是 ,使 相 异 度 矩 阵 A( 具 有 元 素 6; 并且 在 我 们 的 方 
法 中 使 用 式 (17. 1) 进 行 计算 ) 尽 可 能 地 匹配 一 个 低 维 欧 氏 空 间 中 点 与 点 之 间 的 距离 。 该 目 
标 可 以 通过 最 小 化 原始 压力 函数 [30] 进 行规 范 化 : 
o,(Z) = jw; (y — dy (Z))? (7. 5) 
AF, Z 是 一 个 1X2 的 坐标 和 矩阵， 作为 图 的 基础 ，2% 是 物品 i 和 7 之 间 的 相 异 度 ， 
dj (2Z) 是 i 和 j 坐标 的 欧 氏 距离 ， 即 


第 17 章 ”基于 示意 图 的 产品 目录 可 视 化 369 


2 
dy (2) = | Cza — z)? (17. 6) 


同时 ， 通 过 指定 权重 wy 可 使 某 些 相 异 度 能 更 好 地 匹配 。 

我 们 使 用 的 相 异 度 指 标 能 够 处 理 缺失 值 。 然 而 ， 基 于 只 有 几 个 (其 至 都 不 重要 ) 的 非 丢 
失 属 性 的 相 异 度 要 比 相 异 度 分 数 没有 丢失 的 相 异 度 要 更 不 可 信 ， 因 此 后 者 应 该 接受 更 高 的 
权重 。 我 们 可 以 通过 定义 式 (17. 5) 中 的 权重 作为 ij 对 非 丢 失 属 性 的 加 权 平 衡 。 


(17. 7) 


我 们 使 用 SMACOF 算法 [10j 最 小 化 o. (Z) 。 该 方法 的 一 个 优点 是 它 在 理论 上 更 快 并 
且 和 迭代 产生 单调 递增 的 压力 值 ， 并 且 子 结果 坐标 矩阵 Z 中 的 差 收 敛 到 0L10]。 该 性 质 对 动 
态 可 视 化 有 一 个 重要 和 关键 的 影响 : 算法 通过 平滑 改变 的 点 产生 一 个 (局 部 ) 最 小 解 
式 (17. 5)， 实 际 上 该 物品 在 屏幕 上 遵循 一 个 光滑 的 轨迹 。 

当 产 品 数量 过 多 时 ， 生 成 的 图 可 能 对 用 户 看 起 来 过 于 庞大 。 为 了 使 图 对 用 户 更 有 吸引 
力 ， 一 些 产品 通过 大 的 全 彩 图 来 强调 ， 而 其 他 产品 使 用 小 一 点 的 单 色 图 。 这 些 被 强调 的 产 
品 能 帮助 用 户 更 快 地 得 到 一 个 图 的 全 貌 。 通 过 使 用 k-means 方法 聚 类 图 中 的 产品 可 以 实现 
这 一 点 [17]。 我 们 决定 在 图 Z 上 执行 k-means 育 类 而 不 是 在 原始 的 相 异 度 上 执行 分 层 聚 
类 ， 是 考虑 到 两 点 原因 : 第 一 ， 该 过 程 更 快 ; 第 二 ， 它 与 可 视 化 更 一 致 ， 即 图 中 没有 重 
全。 每 一 个 簇 中 ， 与 簇 中 心 欧 氏 距离 最 近 的 产品 被 选择 强调 。17. 6 节 展 示 一 种 用 于 MP3 
播放 器 的 产品 目录 的 该 方法 原型 。 


17.3.2 非 线性 主 成 分 分 析 


第 二 种 创建 产品 目录 图 的 方法 是 基于 NL-PLA。 该 方法 创建 的 图 中 ， 不 只 是 产品 ， 属 
性 分 类 值 也 被 画 出 ， 从 而 可 以 用 于 导航 和 选择 。NL-PCA 是 对 序数 ( 非 线性 排序 ) 分 类 属性 
的 标准 主 成 分 分 析 的 泛 化 。 当 只 有 数字 属性 时 ，NL-PCA 就 简化 为 标准 PCA; 当 所 有 属 
性 值 都 一 样 并 且 选 择 一 个 多 标 称 变换 时 ，NL-PCA 就 等 价 于 齐 次 或 多 重 一 致 性 分 析 。 

在 齐 次 分 析 中 ， 通 过 所 有 属性 的 符号 矩阵 G 对 TXK SEX BR. OL, 表示 属 
TER WERA, SABER 251, on LL 在 TXL 矩阵 中 Ge 有 其 自己 的 列 ， 其 中 1 表示 
该 物品 属于 该 目录 ，0 表示 否 。 多 值 异样 属性 使 用 IX 符号 矩阵 对 每 一 个 目录 建 模 。 缺 失 
值 使 用 一 个 DX I 二 元 对 角 和 矩阵 M， 对 所 有 属性 ， 丢 失 则 值 为 1， 反 之 为 0。 使 用 该 数据 
表示 ， 我 们 可 以 对 齐 次 分 析 定义 如 下 损失 函数 [13，34] 


K 
c (ZiY; YO = K >) tr(Z— GY)'M,G-— GY,) (7. 8) 


Hp Zd&g—41xX258B, dm —HEBKE Ig rus; MAY, 是 属性 & 的 目录 值 的 
二 维 表示 。 物 品 坐标 Z ARE A RAD ds Y, 都 可 以 绘制 在 一 个 叫 作 双 标 图 L15] 的 交叉 空 
间 中 。 本 质 上 ，2Z 一 Ge 表示 单个 产品 的 位 置 及 其 所 属 的 目录 中 心 的 差 (或 误差 )。 理 想 的 
情况 是 ， 没 有 差 值 存在 并 且 所 有 属于 同一 目录 的 产品 都 属于 同一 类 并 和 该 目录 重 倒 。 由 于 
属性 很 多 ， 产 品 在 不 同 的 属性 下 会 填充 到 不 同 的 分 类 ， 式 (17. 8) 简 单 地 通过 产品 与 其 所 属 
分 类 中 心 的 距离 平方 来 衡量 均匀 性 。 和 矩阵 M, 移 除 了 所 有 包含 丢失 属性 值 & 的 产品 对 误差 
的 影响 。 式 (17. 8) 可 用 称 作 同 质 分 析 L[13，34] 的 可 选 最 小 平方 (ALS) 过 程 进行 最 小 化 。 
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同 质 分 析 对 NL-PCA 里 的 分 类 点 进行 了 简单 的 额外 限制 。 要 将 数值 和 序数 属性 整合 
到 同 质 分 析 框 架 ， 可 以 通过 加 一 个 rank-1 限制 
Y; = qui (17. 9) 
给 数值 和 序数 属性 ， 其 中 @ EA L ORR, a 是 一 个 二 维权 值 列 向 
量 。 使 用 该 限制 分 类 点 被 排 成 一 条 线 。 但 是 ， 该 限制 不 足以 保存 序数 属性 的 顺序 甚至 数值 
属性 的 相对 距离 。 因 此 ， 每 个 ALS 迭代 中 都 对 q 进行 约束 以 满足 前 述 限 制 。 序 数 属 性 通 
过 加 权 单调 回归 进行 变换 [9]， 至 于 数字 属性 ， 则 通过 用 属性 的 序数 值 x, 替代 gx。 关于 
NL-PLA 的 ALS 算法 的 详细 描述 在 L13，31，34]。 
NL-PCA 的 解 的 一 些 优 点 使 得 它 更 适 于 创建 既 包 含 产 品 也 包含 属性 分 类 值 的 图 。 
。 NL-PCA 提供 一 个 物品 点 和 属性 分 类 点 的 交叉 空间 ， 称 为 双 标 图 L15]， 而 其 他 可 
视 化 方法 则 只 提供 物品 点 。 分 类 点 可 用 于 为 图 提供 更 简单 的 解释 和 通过 选择 产品 
子 集 导航 整个 图 。 
。 对 于 分 类 属性 ， 分 类 点 处 于 所 属 物品 点 的 中 心 。 这 意味 着 当 某 个 属性 在 图 中 充分 
体现 出 来 时 ， 对 象 被 聚 类 在 该 属性 相应 的 分 类 值 周围 ， 选 择 所 有 属于 该 分 类 的 点 
就 选 出 了 图 上 的 一 个 子 空 间 。 序 数 属性 的 目录 点 将 是 线 上 最 接近 物品 点 中 心 的 点 。 
。 NL-PCA 和 大 多 数 其 他 可 视 化 方法 的 第 三 个 优点 是 ， 图 中 物品 点 的 距离 通常 相关 
于 它们 的 相 异 度 。 
17. 6 节 也 将 展示 一 个 该 方法 在 MP3 播放 器 上 的 应 用 。 


17.4 通过 点 击 流 分 析 决 定 属性 权重 


17. 3 节 介 绍 的 两 种 产品 目录 图 的 生成 方法 ， 都 认为 所 有 属性 对 用 户 同等 重要 。 然 而 ， 
我 们 通过 MDS 方法 的 相 异 度 指标 整合 属性 权 值 ;， 同 样 NL-PCA 也 可 以 调整 以 整合 不 同 的 
属性 权 值 。 它 适用 于 大 部 分 可 视 化 方法 ， 包 括 17. 2 节 介绍 的 自 组织 图 和 树 图 。 

本 节 将 介绍 一 种 根据 点 击 流 数据 自动 决定 这 些 权 值 的 方法 。 我 们 统计 每 个 产品 在 一 段 
时 期 被 卖 出 的 次 数 。 在 17. 6 节 展 示 的 应 用 中 ， 我 们 实际 上 统计 了 跳出 率 ， 即 跳出 一 个 可 
购物 商店 (我 们 使 用 一 个 比价 网 的 数据 ) 的 点 击 。 为 了 更 容易 阅读 ， 我 们 在 后 面 使 用 术语 销 
量 而 不 是 跳出 率 。 根 据 这 些 统计 和 产品 属性 ， 我 们 估计 了 一 个 泊 松 回归 模型 ， 该 模型 属于 
通常 的 线性 模型 。 根 据 该 模型 的 系数 和 相应 的 标准 误差 ， 我 们 计算 了 上 值 ， 作 为 我 们 属性 
权 值 的 基础 。 该 方法 早期 描述 于 文献 [22]。 


17.4.1. 泊 松 回归 模型 


一 些 常常 用 于 统计 学 领域 的 模型 是 广义 线性 模型 (GLM)[32，35]。 为 了 建 模 一 个 高 
散 非 负 的 独立 计数 变量 ， 如 销量 ， 我 们 使 用 GLM 家 族 中 的 一 个 合适 的 成 员 ， 即 泊 松 回归 
模型 。 在 泊 松 回归 中 ， 我 们 不 能 直接 使 用 (多 值 ) 分 类 属性 ， 所 以 不 得 不 创建 虚拟 属性 进行 
替代 。 每 个 虚拟 属性 用 L,—1 个 虚拟 值 zw 表示 ， 当 物品 属于 该 分 类 为 1， 反 之 为 0， 其 中 
Li 是 属性 & 的 不 同 分 类 的 数量 。 当 一 个 物品 属于 最 后 一 个 分 类 L, 时 ， 所 有 该 属性 的 虚拟 
值 都 为 0。 选择 这 种 表示 方法 是 为 了 避免 多 重 共 线性 。 对 多 值 分 类 属性 使 用 同样 的 方法 ， 
只 是 现在 所 有 分 类 都 用 Li 个 虚拟 值 表示 。 对 于 数值 属性 ， 我 们 就 使 用 该 属性 本 身 。 因 此 
te mirus L1. 我 们 得 到 物品 i 在 向 量 x; 中 的 所 有 zw o 一 个 截 距 项 zw 也 被 包含 在 该 向 
量 中 ,对 所 有 物品 ， 其 值 为 1。 因 此 ， X= (Los fuo t5, Zi, ) 有 了 对 所 有 I 个 物品 的 独 
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. 立 的 统计 变量 值 y;， 我 们 就 可 以 如 下 表示 泊 松 回归 模型 
y; ~ exp(xi b) (17. 10) 
其 中 心 是 待 估 回归 参数 向 量 ， 进 一 步 假设 y; IRM E CexpGo 00 BOTR E21 .. KIA 
松 回归 模型 可 以 通过 最 大 似 然 度 函 数 进行 拟 合 ， 通 常 使 用 迭代 加 权 最 小 二 乘法 实现 。 除 了 
模型 参数 by, EX ww 也 可 以 通过 该 法 得 到 。 


17.4.2 处 理 缺 失 值 


遗憾 的 是 ， 泊 松 回 归 模型 不 能 同时 处 理 缺 失 值 。 缺 失 值 是 GLM 中 的 一 个 常见 问题 ， 
IMbrahim 等 [20] 最 近 比 较 了 处 理 GLM 中 缺失 值 的 不 同 技术 。 其 中 一 种 最 好 的 方法 (产生 
无 偏 佑 计 和 可 信和 标准 差 ) 叫 多 重 填补 (MI)L41]。MI 方法 根据 非 缺 失 值 的 分 布 来 填补 缺失 
值 以 得 到 一 组 “完整 "数据 集 。 这 些 虚拟 数据 集 可 用 两 种 方法 创建 : 数据 扩充 L43] 和 重要 性 
采样 / 重 采样 LC26]。 虽 然 这 些 方法 的 结果 质量 都 差不多 ,但 是 第 二 种 方法 计算 速度 更 快 。 
因此 ， 使 用 第 二 种 方法 的 算法 一 一 Amelia 算法 [26]， 作 为 一 个 统计 软件 环境 R 的 包 , 用 
于 我 们 的 方法 。 我 们 在 文献 L[22] 中 讨论 了 如 何 用 虚拟 数据 集 的 回归 系数 和 标准 差 评 估 估 计 
泊 松 回归 模型 的 参数 和 标准 差 。 


17.4.3 试用 泊 松 回归 选择 权 值 


有 三 个 理由 使 我 们 不 能 直接 使 用 从 泊 松 模型 得 到 系数 bw 作为 权重 。 第 一 ， 相 异 度 分 
数 并 且 属 性 的 数量 级 不 同 。 第 二 ， 当 直接 使 用 bw 时 ,没有 考虑 系数 正确 性 的 不 确定 性 。 
即使 系数 值 较 大 ， 它 仍然 可 能 不 重要 。 例 如 ， 考 虑 一 个 有 着 很 少 1 和 很 高 系数 值 的 虚拟 属 
性 ， 由 于 它 的 高 系数 只 用 在 了 有 限 个 物品 上 ， 限 制 了 它 的 总 体重 要 性 。 我 们 可 以 通过 将 不 
确定 性 纳入 计算 来 对 此 进行 校正 。 第 三 ， 权 重 应 该 总 大 于 等 于 0 的 , 但 bw 可 能 为 负 。 


ty 二 此 (17. 11) 

前 两 种 问题 可 以 使 用 系数 bw 的 t 值 作为 计算 权 值 的 基础 。 通 过 标准 化 ， 所 有 如 都 处 于 
同一 数量 级 。 并 且 ， 由 于 以 标准 差 w 作为 分 母 ， 不 确定 性 也 被 考虑 了 进来 。 当 使 用 |z | 而 
不 是 tw 时 ， 我们 确保 权 值 大 于 等 于 0。 

对 于 数值 属性 ， 我 们 可 以 把 |tw | 直接 映射 到 一 个 “ 伪 ” 绝 对 1 值 v， 即 对 属性 &，w 王 
| 如 | 。 有 了 权 值 的 标准 化 (为 了 便于 解释 ) ， 我 们 就 可 以 计算 w 

w, = — (17. 12) 
. 22" 
对 于 (多 值 ) 分 类 属性 ， 首 先 必须 使 用 专 的 L, EHE v, CFF 的 平均 绝对 值 





= Ly TN (17. 13) 
进而 结合 式 (17. 12) 8 v, 可 以 计算 多 值 分 类 属性 的 权 值 。 
17.4.4 阶梯 式 泊 松 回归 模型 


+ 值 可 以 同上 分 布 比较 来 判断 是 否 和 0 显著 不 同 。 在 所 谓 的 逐步 模式 中 ， 使 用 该 显著 
性 测试 选择 属性 ， 最 终生 成 一 个 只 包含 显著 属性 的 模型 。 该 逐步 模型 方法 从 一 个 包含 所 有 
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属性 的 模型 出 发 ， 每 一 次 从 中 删除 最 不 显著 的 属性 ， 直 到 该 模型 只 包含 显著 属性 。 注 意 ， 
这 种 逐步 方式 在 同时 删除 所 有 不 显著 属性 时 会 导致 不 一 样 的 模型 。 事 实 上 由 于 共 线 性 ， 当 
某 个 属性 被 删除 时 ， 其 他 属性 的 显著 性 也 可 能 改变 。 当 使 用 逐步 模型 决定 权重 w i, R 
们 将 虚拟 值 个 数 L, 考虑 到 最 终 的 模型 中 。17. 6 节 将 展示 使 用 该 逐步 模型 的 应 用 。 


17.5 图 像 购物 界面 


基于 图 的 可 视 化 思想 可 以 结合 推荐 系统 [39]。 最 直接 的 方法 是 将 推荐 系统 的 结果 用 一 
个 图 来 展示 而 不 是 列表 。 这 种 方法 在 [23j 中 的 图 像 推荐 系统 被 用 到 。 该 论文 还 介绍 了 男 一 
个 系统 ， 图 像 购物 界面 (GSI) 。 当 用 户 不 清楚 自己 想 要 找 什么 并 且 需 要 明确 他 们 的 爱好 时 ， 
GSI 可 以 提供 很 好 的 交互 式 推荐 。GSI 实现 了 一 种 在 推荐 系统 中 叫 作 提议 推荐 [45] 或 者 灵 
感 搜寻 [40] 的 方法 。 其 想法 是 使 用 户 一 步 步 浏 览 整 个 产品 目录 ， 每 一 步 中 只 有 部 分 产品 被 
呈现 在 图 上 。 用 户 可 从 该 图 中 选择 某 个 产品 ， 接 着 和 该 产品 更 相似 的 产品 通过 MDS 生成 
和 显示 ， 该 方法 和 17.3.1 节 基 于 MDS 的 产品 目录 图 类 似 。 

文献 L23] 提 议 了 三 种 不 同类 的 GSI， 即 随机 系统 、 聚 类 系统 和 分 层 系统 。 因 为 随机 系 
n ad ean 所 以 在 此 只 考虑 随机 系统 。 

该 系统 中 ， 每 一 步 从 较 大 集中 随机 选择 小 部 分 产品 展现 给 用 户 ， 该 较 大 集 包 含 与 用 户 所 选 
产品 相似 的 产品 。 ; 8. GSI 需要 初始 化 ， 我 们 以 该 初始 化 作为 迭代 坛 0。 在 该 初始 化 中 ， 较 
大 产品 集 D, 是 完全 产品 目录 集合 ， 即 D, —D. JA D, 中 随机 选择 (无 替代 )p 个 产品 作为 输出 ， 
组 成 小 集合 Do 。 然 后 根据 该 DS 和 合适 的 Gower 系数 计算 相 异 度 和 矩阵 As ，Gower 在 17.3.1 节 
中 提 到 过 。 最 后 ， 使 用 MDS 得 到 的 随机 产品 呈现 在 图 Z, 上 ， 并 将 该 图 呈现 给 用 户 。 

当 用 户 选择 一 个 展示 产品 时 ， 和 迭代 过 程 将 开始 ， 标 记 这 个 产品 为 x* 。 接 着 ， 计 算 x; 
Al D 中 其 他 所 有 产品 的 相 异 度 ， 选 择 和 x^ 最 相似 的 max(p 一 1，a'T 一 1) 个 产品 组 成 D,。 
参数 a (Oa D BE 87b 3S [Vr D, 的 减少 量 。 之 后 的 过 程 和 初始 化 几乎 一 样 。 我 们 从 D, 
中 随机 选择 之 一 1 个 产品 和 xe 组 成 小 集 Dw ， 并 计算 相 异 度 矩阵 A; . RU 那个 键 一 个 由 
x; 和 pp 一 1 个 从 D, 中 随机 选择 的 产品 组 成 的 小 集合 D7 ， 并 计算 相似 度 和 矩阵 作为 MDS E 
法 的 输入 ， 并 返回 新 图 Z. 

参数 a 决定 用 户 整 个 选择 过 程 的 影响 程度 。 当 a 二 1 时 ， 这 个 影响 非常 小 ， 因 为 除了 
最 后 一 次 迭代 用 户 选 择 的 产品 ， 每 次 迭代 都 是 完全 随机 选择 产品 展现 给 用 户 ; a 较 小 时 ， 
影响 较 大 ， 但 是 D, 方差 减少 也 更 快 。 图 17. 5 对 这 个 随机 系统 进行 了 概述 。 

procedure RANDOM,SI(D, p, Œ) 
Do =D. 
Generate random Dj C Do with size p. 
Compute 40 given D$ using (17.1). 
Compute Zo given Ag using MDS. 
t=0. 
repeat 
t=t+l1. 
Select a product xf € D? ,. 
Get D, C D containing max(p — 1, œI — 1) products most similar to x7 using (17.1). 
Generate random Df C D; with size p — 1. 
Dt = D{ Uxt. 
Compute A; given D} using (17.1). 
Compute Z, given A: using MDS. 
until D? = D; ,. 
end procedure 





图 17.5 图 形 购物 界面 伪 代 码 
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在 17.6 节 也 展示 GSI 的 一 个 应 用 。 
17.6 电子 商务 应 用 


本 节 介 绍 三 种 在 线 应 用 原型 ， 有 两 种 是 基于 MDS 和 NL-PCA 来 应 用 于 产品 目录 图 
的 ， 第 三 种 原型 是 GSI(graphical shopping interface), MDS 和 GSI 都 使 用 了 17. 4 节 中 的 
方法 来 决定 权 值 。 所 有 原型 都 使 用 下 面 的 MP3 播放 器 产品 目录 。 

MP3 播放 器 产品 目录 由 Compare Group 提供 ， 其 拥有 欧洲 比价 网 站 中 的 Dutch 比 
fft P] http://www. vergelijk. nl。 我 们 所 用 的 产品 目录 是 来 自 该 网 站 2007 年 10 月 的 数 
据 库 备 份 。 当 时 ， 该 网 站 有 225 3k MP3 播放 器 ， 这 些 播放 器 用 45 种 属性 描述 ， 其 中 
16 种 数值 的 20 种 分 类 的 和 45 种 多 值 分 类 。 在 这 45 种 属性 中 ， 有 26 种 属性 值 的 缺 
失 值 超过 了 一 半 ， 不 同 于 [21，23，24] 中 使 用 的 。 为 了 能 够 如 17. 4 节 中 所 述 的 自动 
决定 权 值 ， 我 们 将 2007 年 7 月 15 日 到 9 月 15 日 这 2 个 月 的 产品 目录 和 相同 网 站 的 
点 击 流 日 志 进 行 了 匹配 。 


表 17.2 MP3 播放 器 数据 的 属性 特征 。 这 里 只 列 出 了 缺失 值 少 于 50% 的 属性 。 
对 (多 值 ) 分 类 属性 来 说 ， 只 显示 3 个 最 常见 的 值 










Price 134. 54 













Height 63. 65 
Width 48. 87 
数值 属性 Weight 71.21 
Depth 16. 54 
Memory Size 8635. 30 
Battery Life 17. 26 






0.0% Samsung(12. 0%), Creative(9. 8%), Philips(8. 4%) 
32.0% yes(68. 6%), no(31. 496) 

44.9% yes(17. 796) , no(82. 34) 

39.6% yes(85. 356) , no(14. 794) 

30.2% yes(99. 496) , no(0. 6%) 

44.4% li—ion(44. 896) , 1X &AA(33. 6%), li— polymer(20. 8%) 
24.4% yes(81. 226) , no(18. 8%) 

42.7% flash memory(69. 0%), hdd(21. 7%), sd card(10. 1%) 
4.0% usb(63. 496), usb 2. 0(31. 596) , hi-speed usb(7. 4%) 
38.2% black(68. 3%), white(20. 1%), silver(16. 596) 
31.1% windows(78. 7%), mac os(34. 2%), windows xp(32. 3%) 
1.8% MP3(98. 696), WMA(90. 096), WAV(48. 0%) 


Brand 
Radio 









Extendable Memory 
分 类 属性 


Equalizer 






Screen 


Battery Type 










Voice Memo 





Storage Type 






Interface 


多 值 分 类 属性 






Color 






Operating System 





Audio Formats 





17.6.1 使 用 属性 权 值 的 基于 MDS 的 产品 目录 图 


基于 MDS 的 产品 目录 图 原型 的 JAVA 应 用 可 从 http://www. browsingmap. com/ 
mapvis. html 获得 ， 这 个 原型 展示 见 图 17. 6。 该 原型 的 GUI 主要 由 一 个 大 的 焦点 图 组 成 ， 
该 焦点 图 包含 了 完整 图 中 部 分 产品 的 详细 视图 。 该 图 中 ， 一 些 产品 (本 例 中 为 12) 用 较 大 的 
全 彩 图 展示 ， 其 他 产品 则 用 较 小 的 单 色 图 。 单 色 图 默认 根据 它们 所 属 的 簇 着 色 。 用 户 可 以 
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根据 产品 的 流行 度 ( 基 于 点 击 流 数 据 ) 或 者 属性 值 着 色 。 顶 部 小 图 总 是 展示 整个 产品 目录 
图 。 用 户 可 以 以 多 种 方式 浏览 整个 目录 图 。 通 过 在 焦点 图 或 全 览 图 中 选择 一 个 矩形 子 空 
间 ， 用 户 可 以 在 图 的 特定 部 分 进行 缩放 ， 也 可 以 通过 鼠标 滚轮 方式 完成 。 用 户 还 可 以 通过 
拖 搜 在 图 上 移动 。 由 于 图 本 身 是 静态 的 ， 即 产品 坐标 是 固定 的 ， 图 的 计算 可 以 离线 进行 ， 
以 减少 在 线 计算 时 间 。 当 然 ， 直接 的 方法 是 加 入 传统 的 搜索 技术 ， 例如， 在 图 的 界面 中 能 
执行 明确 的 查询 ， 剩 下 的 所 有 满足 约束 的 产品 可 用 图 展示 。 这 要 求 当 产品 变化 时 图 随 之 发 
生 调 整 ， 所 以 客户 端的 计算 可 能 是 必要 的 。 











图 17.6 基于 MDS 的 产品 目录 图 原型 的 截图 


原型 图 通过 17. 4 节 中 的 属性 权 值 确定 技术 来 实现 。 这 些 权 值 根据 上 述 数据 和 产品 目 
录 来 决定 。 为 了 能 够 估算 缺失 值 ， 我 们 表 7.3 对 MP3 播放 器 目录 采用 逐步 泊 松 回归 模型 


剔除 了 包含 超过 50%% 缺 失 值 和 出 现 不 到 确定 的 权 值 。 只 显示 了 选中 的 属性 
10 次 的 多 值 分 类 的 分 类 属性 。 用 这 种 Attribute Weight 
方式 得 到 的 权 值 列 在 表 17.3 p. HER, Brand 0. 242 
表 中 没有 提 到 的 属性 值 为 0， 因 此 ， 对 E 0. 176 
MDS 过 程 没有 影响 。 根 据 我 们 的 算法 ， ane — 
品牌 和 内 存 大 小 是 决定 MP3 播放 器 流 Width 0.090 
行 度 最 重要 的 属性 ， 因此 得 到 最 高 的 Operating System 0. 086 
权重 。 Color 0. 084 

在 图 17.7 中 ， 我 们 标 出 了 两 种 图 Storage Type 0. 084 


的 产品 点 ， 图 17. 7a 是 MSD 根据 所 有 
属性 的 权 值 都 均等 的 方法 得 到 的 图 ， 图 17. 7b 是 我 们 根据 对 应 品牌 赋 权 方法 得 到 的 图 。 第 
二 种 图 通过 Procrustean 变化 [16] 旋 转 ， 与 第 一 种 图 达到 最 佳 匹配 。 由 于 品牌 变 得 更 重要 ， 
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同 品牌 的 产品 在 第 二 个 图 中 更 容易 被 聚 类 。 

图 17. 8a 展示 了 第 二 种 重要 属性 ， 即 内 存 大 小 。 该 图 展示 的 MP3 播放 器 通常 按 左上 
角 到 右 下 角 价 格 从 低 到 高 进行 排序 。 最 显著 的 属性 一 一 价格 在 表 17. 3 中 缺失 ， 从 而 权 值 
为 0。 图 17. 8b 是 使 用 价格 标记 的 图 ， 图 上 有 一 个 明显 的 模式 。 因 为 价格 和 MP3 的 其 他 属 
性 高 度 相 关 ， 如 内 存 大 小 ， 因 此 这 些 属性 能 解释 大 部 分 物品 的 价格 。 


T 





a) 均等 权 值 b) 泊 松 回归 权 值 
17.7 标示 有 品牌 的 基于 MDS 的 产品 目录 图 





a) 内 存 大 小 b) 价格 
图 17.8 标示 有 内 存 大 小 和 价格 的 基于 MDS 的 产品 目录 图 


更 通用 的 是 ， 我 们 可 以 发 现 MDS 生成 一 种 带 离 群 值 的 圆 形 图 ， 离 群 值 和 其 他 的 产品 
非常 不 同 。 因 此 ， 图 中 大 部 分 没 被 用 到 。 另 一 方面 ， 重 要 的 属性 显示 出 清晰 的 模式 ， 图 在 
第 一 眼 就 提供 一 个 好 的 解释 。 


17.6.2 基于 NL-PCA 的 产品 目录 图 


图 17. 9 显示 了 一 个 使 用 NL-PCA 的 原型 截图 。 该 应 用 可 在 http: // www. browsingmap. com/ 
mapvis. html 获得 。GUI 的 主要 部 分 是 产品 目录 图 。 最 开始 ， 该 图 展示 所 有 产品 。 少 量 ( 本 
例 为 12 个 ) 产 品 使 用 大 的 全 彩 图 展示 ， 其 他 产品 使 用 较 小 的 单 色 图 。 和 基于 MDS 方法 的 
产品 目录 图 一 样 ， 对 初始 图 使 用 k-means 聚 类 过 程 来 选择 要 突出 显示 的 产品 。 
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图 17.9 基于 NL-PCA 的 产品 目录 图 原型 的 截图 


上 述 所 有 产品 目录 图 都 有 一 个 产品 属性 列表 ， 每 个 属性 可 以 通过 在 选择 框 上 点 击 来 选 
择 。 如 果 一 个 属性 被 选择 ， 这 个 分 类 的 属性 点 将 被 增加 到 图 上 。 该 图 所 选 属性 的 分 类 点 不 
只 是 帮助 用 户 解释 图 ， 同 时 也 是 导航 整个 图 的 工具 。 通 过 点 击 图 上 的 分 类 点 ， 目 录 被 添加 
进 选择 列表 中 。 

选择 列表 展示 在 属性 列表 的 右边 ， 决 定 了 产品 在 图 中 高 亮 突出 显示 。 被 突出 显示 的 产 
品 集 由 如 下 方法 决定 。 对 每 一 个 被 选 属性 ， 一 个 展示 产品 应 该 属于 至 少 一 个 被 选 分 类 。 

当选 择 列表 通过 增加 或 移 除 分 类 点 的 方式 调整 后 ， 图 的 可 视 化 发 生 了 改变 。 首 先 所 有 
满足 新 约束 的 产品 设 为 红色 ， 其 他 为 蓝 色 ; 然后 从 中 随机 选择 一 些 产 品 高 亮 突 出 显示 。 

因为 一 次 选择 一 般 产 生 图 的 一 个 子 集 ， 也 可 能 对 部 分 图 放大 。 然 而 ， 不 能 保证 所 有 子 
空间 节点 满足 选择 列表 中 的 全 部 约束 。 我 们 选择 不 删除 这 些 产品 点 ， 因 为 它们 可 能 是 用 户 
感 兴趣 的 。 虽 然 这 些 产 品 不 满足 用 户 的 所 有 需求 ， 但 是 它们 和 那些 具有 或 者 可 能 具有 用 户 
感 兴趣 属性 的 产品 非常 相似 。 

在 完全 和 缩放 图 上 ， 用 户 可 以 点 击 典型 产品 来 得 到 一 个 完整 的 产品 描述 ， 显 示 在 应 用 
的 右边 。 然 而 ， 在 一 个 全 彩 图 和 单 色 图 上 滑动 时 ， 会 显示 一 个 包含 该 产品 和 重要 属性 值 的 
提示 框 。 另 外 ， 选 择 列表 中 的 属性 值 也 被 展示 在 提示 框 中 ， 当 它们 匹配 偏好 目录 值 时 为 绿 
色 ， 反 之 为 红色 。 由 于 GUI 是 基于 单个 NL-PCA 图 的 ， 也 可 以 像 MDS 产品 目录 图 一 样 进 
行 离线 计算 。 

由 于 在 含有 大 量 缺 失 值 的 时 候 ，NL-PCA 图 的 质量 将 变 得 非常 差 ， 我 们 剔除 含 超过 
50% 缺 失 值 的 属性 值 。 我 们 也 剔除 超过 50% 限 制 属性 集中 的 产品 。 最 后 产生 一 个 包含 19 
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个 属性 、189 个 MP3 播放 器 的 集合 ， 如 表 17. 2 Hm. 

在 NL-PCA 算法 中 ， 我 们 把 所 有 数值 属性 当 作 有 序 的 ， 有 两 个 原因 : 第 一 ， 对 用 户 
来 说 很 多 数值 属性 没有 线性 解释 ， 如 内 存 大 小 ; 第 二 ， 由 于 潜在 的 单调 回归 过 程 ， 一 些 临 
界 分 类 可 以 合并 到 一 个 单独 的 分 类 点 。 由 于 一 个 数值 属性 包含 大 量 的 分 类 ( 即 数据 集中 的 
所 有 值 都 是 唯一 的 ) ， 可 视 化 所 有 的 这 些 属性 可 能 变 得 不 清楚 ， 并 且 使 用 这 些 分 类 值 的 选 
择 可 能 没 用 。 也 因此 ， 大 量 的 分 类 只 属于 一 个 对 象 。 使 用 一 个 序数 转换 会 让 这 不 是 问题 ， 
因为 少量 物品 会 合并 到 它们 的 邻居 。 

图 17. 10 展示 了 通过 NL-PCA 算法 得 到 的 两 个 双 标 图 。 每 个 双 标 图 表示 产品 的 属性 值 
和 产品 分 类 值 。 并 且 ， 双 标 图 中 标记 一 个 原点 。 根 据 NL-PCA 方法 的 设计 ， 普 通常 规 产 
品 ( 和 其 他 很 多 产品 属性 相似 的 产品 ) 应 该 更 靠近 原点 ， 而 独特 产品 应 该 远离 原点 ， 分 类 点 
同 理 。 由 于 图 17. 10 中 的 两 种 双 标 图 都 是 由 数值 属性 而 来 的 ， 所 以 所 有 分 类 点 在 一 条 线 
上 。 像 MDS 图 中 一 样 ， 价 格 和 内 存 大 小 彼此 相关 ， 并 且 在 每 个 双 标 图 的 第 二 维 上 充分 
体现 。 





a) 内 存 大 小 b) 价格 
图 17.10 标 有 内 存 大 小 和 价格 的 基于 NL-PCA 的 双 标 图 。 大 图 是 分 类 点 ， 小 点 代表 目标 点 


第 二 个 维度 告诉 我 们 关于 内 存 大 小 和 属性 的 相关 性 ， 而 第 一 维 区 分 新 旧 产 品 。 如 
图 17. 11 所 示 ， 我 们 使 用 界面 属性 标记 产品 。 由 于 界面 是 一 个 多 值 分 类 属性 ， 我们 可 以 只 
通过 单 值 标记 每 个 产品 ， 即 产品 目录 中 最 频繁 的 一 个 。 同 时 ， 我 们 只 展示 三 个 最 常 发 生 的 
分 类 点 ， 所 以 所 有 产品 至 少 属于 他 们 中 的 一 个 。 如 上 所 述 ， 这 里 有 两 个 群 ， 支 持 USB 的 
IH MP3 播放 器 和 支持 USB 2. 0 的 新 MP3 播放 器 。 对 操作 系统 属性 我 们 可 以 观察 到 类 似 的 
模式 。 

更 普遍 的 ，NL-PCA 方法 创建 的 图 比 MDS 方法 使 用 了 更 多 的 可 用 空间 。 但 是 图 的 大 
部 分 是 用 于 可 视 化 特定 而 非 一 般 的 产品 ， 而 后 者 被 聚 类 到 图 的 右上 角 。 同 样 ， 该 图 只 展示 
不 含 过 多 缺失 属性 值 的 产品 。 


17.6.3 图 像 购物 界面 


图 17. 12 展示 一 个 图 像 购物 界面 原型 。 该 原型 可 从 http://www. browsingmap. com/ 
mapvis. html 获取 。 界 面 使 用 4 个 标号 : 实现 图 像 购物 界面 的 导航 标签 ;实现 图 像 推荐 的 
直接 搜索 标签 [23]; 设置 权 值 的 偏好 标签 ; 保存 产品 的 存储 标签 。 
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图 像 推 荐 系统 根据 一 个 搜索 查询 创建 一 个 产品 图 ， 与 该 查询 最 相似 的 产品 被 呈现 。 使 
用 图 而 不 是 通常 的 列表 有 一 个 优点 ， 它 能 更 清楚 地 知道 哪些 查询 结果 相似 和 当 使 用 不 同属 
性 集 的 查询 时 会 产生 哪些 变化 。 

在 GSI 和 GRS 图 中 ,产品 用 缩 略 图 显示 ， 通 
过 点 击 选择 产品 ， 并 在 图 右边 显示 详细 信息 。 在 
GSI 标签 的 图 上 有 进入 下 一 次 迭代 、 回 到 上 一 次 选 
代 、 重 启 和 保存 的 按钮 。 

在 偏好 标签 中 用 户 可 以 设 定 GRS 和 GSI Pit 
算 相 异 度 的 权 值 。 用 户 也 可 以 取消 某 些 属性 ， 让 它 
们 的 权 值 为 0。 当 权 值 变化 时 ， 图 立即 调整 。 该 标 
签 还 有 一 个 “智能 权 值 >? 按钮， 使 用 17. 4 节 的 方法 
决定 权 值 ， 如 表 17. 3 所 示 。 

GSI 两 步 之 间 有 一 个 流畅 转换 。 在 用 户 选 择 某 
个 产品 后 ， 新 的 产品 被 添加 到 图 的 随机 位 置 。 随 图 17.11 标 有 界面 的 基于 NL-PCA 的 双 
后 ， 图 使 用 MDS 进行 优化 。 优 化 过 程 被 展示 给 用 标 图 。 大 块 表明 分 类 点 ， 小 的 
户 。 当 优化 收敛 时 ， 旧 产品 逐渐 变 得 越 来 越 不 重要 透明 块 代表 目标 点 
(使 用 MDS 版 本 的 权重 )， 直 到 它们 的 影响 度 为 零 。 最 终 ， 旧 产品 从 图 中 移 除 ， 新 图 达到 
最 优 。 该 实现 产生 流畅 的 可 视 转 换 ， 这 对 有 效 的 GUI 特别 重要 。 
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17.12 基于 MDS 的 产品 目录 图 原型 的 截图 


当 应 用 启动 时 ，GSI 标签 首先 展示 一 个 包含 属性 和 属性 值 的 树 形 结构 ， 用 来 对 下 级 产 
品 的 预选 。 通 过 这 种 方式 ， 用 户 可 以 排除 他 明确 不 感 兴趣 的 产品 。 

由 于 GSI 图 是 动态 生成 的 ， 依 赖 于 用 户 输入 和 随机 过 程 ， 我 们 无 法 在 此 给 出 结果 。 
[23] 使 用 了 另 一 个 MP3 播放 器 目录 ， 发 现 这 些 图 理论 上 的 质量 (就 压力 值 而 言 ， 参 昭 
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式 (17. 5)) 很 高 ， 主 要 是 因为 它们 只 显示 8 个 产品 。 另 外 ， 推 荐 算法 在 仿真 研究 测试 中 也 
得 到 了 理想 的 结果 。 

文献 L[23] 中 记录 了 一 个 基于 71 个 调查 对 象 的 可 用 性 研究 。 研 究 结果 显示 ， 虽 然 和 传 
统 基于 列表 的 界面 相 比 ， 用 户 觉得 GSI 更 复杂 ， 但 仍 没 有 明显 的 不 满意 。 毕 竟 ， 这 只 是 调 
查 对 象 第 一 次 使 用 GSI。 一 些 该 可 用 性 研究 中 对 GSI 不 利 的 因素 也 应 考虑 进来 。 首 先 ， 在 
该 实验 中 ， 由 于 图 像 推 荐 标签 被 关闭 ， 用 户 错过 了 一 种 表达 查询 的 方式 。 第 二 ， 用 户 错过 
了 一 种 限制 搜索 空间 的 方式 ， 这 种 方式 是 由 一 种 新 原型 的 选择 树 所 提供 的 。 

然而 ，GSI 方法 的 主要 缺点 似乎 还 是 它 的 复杂 性 。 基 于 该 想法 ， 静 态 的 产品 目录 图 可 
能 是 更 好 的 选择 。 这 些 都 还 待 进一步 的 可 用 性 研究 测试 。 


17.7 总 结 与 展望 


本 章 讨 论 了 可 以 将 产品 目录 可 视 化 在 一 个 图 中 ， 来 提供 一 种 使 电子 商务 网 站 用 户 得 到 
更 好 的 可 用 产品 的 概览 。 在 这 样 的 图 中 ， 属 性 相似 的 产品 应 该 被 放 得 靠近 彼此 ， 而 不 相似 
的 物品 应 该 被 放 在 图 的 不 同 区域 。 

在 这 本 章 的 框架 中 ， 两 种 框架 用 于 创建 图 : 多 维 缩放 (MDS) 和 非 线 性 主 成 分 分 析 
CNL-PCA) 。 产 品 间 的 相似 度 尽 可 能 地 对 应 于 二 维 空间 中 的 距离 。 我 们 结合 了 MDS 方法 
和 Gower 系数 ， 使 得 它 能 灵活 处 理 混 合 属性 类 和 缺失 值 。 在 MP3 播放 器 应 用 上 使 用 的 
MDS 方法 似乎 对 产品 徐 和 重要 价格 维度 有 一 个 清楚 的 解释 。 该 图 (以 及 MDS) 的 主要 缺点 
是 有 一 个 使 得 图 打开 的 圆 角 ， 并 且 离 群 值 位 置 相对 图 其 他 部 分 过 远 。 但 是 ， 使 用 加 强 小 相 
似 度 权 值 的 方案 可 以 克服 该 问题 。 

NL-PCA 是 唯一 能 够 在 可 视 化 产品 旁 可 视 化 属性 分 类 的 方法 。 这 些 分 类 点 可 以 用 来 选 
择 图 中 的 产品 子 集 ， 就 像 我 们 原型 中 展现 的 那样 。NL-PCA 图 通常 与 MDS 解释 一 致 。 虽 
然 NL-PCA 方法 中 离 群 产品 占 了 图 的 大 部 分 ， 但 在 图 中 更 分 散 。NL-PCA 的 主要 缺点 是 ， 
我 们 不 能 可 视 化 所 有 产品 ， 因 为 NL-PCA 在 物品 包含 太 多 缺失 值 时 会 生成 很 烂 的 图 。 另 
一 个 缺点 是 产品 间 的 相似 度 不 是 像 MDS 方法 那样 直接 对 应 于 距离 。 虽 然 也 可 以 通过 不 同 
的 标准 化 方法 完成 ， 但 分 类 点 的 解释 就 变 得 困难 了 ， 意 味 着 不 能 再 用 于 导航 了 。 

由 于 用 户 通 常 不 认为 所 有 产品 属性 同等 重要 ， 我 们 展示 了 一 种 基于 泊 松 回归 模型 的 方 
法 ， 可 以 通过 点 击 流 日 志文 件 中 的 产品 流行 度 自 动 决定 属性 的 重要 性 权 值 。 由 于 该 方法 独 
立 于 可 视 化 技术 ， 因 此 可 用 于 涉及 权 值 的 技术 ， 甚 至 可 以 用 于 涉及 属性 权 值 的 推荐 系统 。 
该 方法 也 有 一 个 缺点 ， 分 类 属性 的 权 值 是 通过 一 种 特别 启发 式 的 方式 决定 的 ， 属 性 间 的 关 
联 被 忽略 了 。 因 此 ， 我 们 用 另 一 种 方式 决定 这 些 权 值 ， 一 种 更 灵活 的 基于 加 速 回归 树 的 
模型 。 

通过 引进 图 像 购 物 界面 ， 我 们 介绍 了 一 种 可 结合 推荐 技术 的 基于 图 的 可 视 化 方法 。 当 
然 ， 该 方法 也 可 结合 其 他 基于 内 容 和 知识 的 推荐 技术 ， 如 评价 (参看 文献 [70] 和 第 13 章 )。 

除了 和 其 他 推荐 方式 的 结合 ， 我 们 认为 产品 目录 可 视 化 还 存在 着 一 些 挑 战 。 首 先 ， 由 
于 决定 图 好 坏 是 个 人 品味 问题 ， 和 待 可 视 化 的 数据 有 关 ， 我 们 尝试 用 不 同 的 可 视 化 方法 ， 
如 独立 成 分 分 析 [8] 或 者 投影 追寻 [12]。 一 个 好 主意 是 ， 在 用 户 研究 中 比较 不 同 的 可 视 化 
方法 。 在 该 用 户 研 究 中 ， 我 们 使 用 了 一 个 合理 大 小 的 数据 集 。 因 为 使 用 更 大 (成 千 上 万 ) 的 
产品 目录 ， 就 意味 着 用 于 创建 图 的 算法 和 界面 本 身 也 应 该 能 够 处 理 这 样 大 的 数 。 除 了 可 视 
化 海量 产品 目录 类 ， 另 一 个 挑战 是 创建 包含 多 类 产品 的 图 ， 如 电子 设备 。 
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Barry Smyth、 Mautice Coyle 和 Peter Briggs 


摘要 ”搜索 引擎 是 数 以 百 万 计 的 用 户 每 天 获取 信息 的 主要 手段 ;先进 搜索 引擎 的 成 功 
与 大 规模 使 用 是 近 十 年 来 学 术 与 工业 进步 的 一 个 见证 。 然 而 ， 当 前 主流 的 搜索 引擎 仍然 向 
他 们 的 用 户 提 供 一 刀 切 (one-size-fits-all) 的 服务 ， 最 终 限 制 了 结果 列表 (与 用 户 查 询 ) 的 相 
关 性 。 本 章 将 探讨 在 我 们 寻求 新 的 、 更 加 社会 化 的 搜索 引擎 过 程 中 ， 一 些 力求 使 Web 搜 
索 体验 更 个 性 化 与 协作 的 最 新 研究 。 


18.1 简介 


Web 搜索 引擎 是 当今 最 重要 、 最 广泛 使 用 的 信息 工具 之 一 。 主 要 的 几 个 搜索 引擎 每 月 
向 数 十 亿 用 户 提供 搜索 结果 ， 同 时 ， 每 年 在 这 个 过 程 中 获得 数 十 亿美 元 的 广告 收入 。 其 
中 ， 谷 歌 是 绝对 的 市 场 领导 者 ,但 这 是 它 应 得 的 ， 因 为 它 解 决 了 所 有 主要 的 网 络 搜索 挑 
战 ， 剩 下 的 只 是 一 些 细微 的 算法 改进 。 但 现实 是 变幻 莫 测 的 ， 也 许 谷歌 已 经 赢得 了 这 一 轮 
的 搜索 混战 ， 但 网 络 搜索 战役 还 远 未 结束 。 

最 近 的 一 些 研究 表明 ， 即 使 主流 搜索 引擎 ， 如 果 给 所 有 搜索 关键 词 相同 的 用 户 返回 相 
同 的 相关 文档 结果 ， 其 准确 率 也 非常 低 。 例 如 ， 在 一 个 针对 超过 20 000 个 搜索 查询 的 研究 
[24] 中 ， 研 究 人 员 发 现 : 平均 来 看 ， 谷 歌 返 回 的 结果 中 ， 至 少 包含 一 个 可 用 项 的 结果 比例 
仅 占 48%。 也 就 是 说 ， 有 52% 的 查询 ， 搜 索 者 不 从 返回 结果 中 选择 任何 项 。 在 这 个 问题 
上 ， 很 大 程度 上 不 仅 是 搜索 引擎 的 问题 ， 也 是 搜索 者 的 问题 : 我们 的 查询 往往 是 模糊 而 不 
确定 的 ， 很 少 可 以 明确 地 表达 我 们 的 搜索 需求 L100，98，99，45，90]。 对 于 经 常 使 用 搜 
索引 擎 的 人 来 说 ,我 们 已 经 习惯 了 这 种 成 功率 ， 并 通过 不 断 浏览 更 多 搜索 结果 或 者 更 改 查 
询 词 来 应 对 。 但 这 充其量 只 能 说 明 现 在 的 搜索 引擎 还 远 没有 达到 它 应 有 的 高 效 一 一 甚至 有 
研究 表明 ， 信 息 工 作者 有 10% 的 经 费 浪费 在 了 搜索 时 间 上 [30]， 最 糟糕 的 是 ， 很 大 一 部 分 
的 搜索 者 根本 无 法 找到 他 们 需要 的 信息 。 

因此 ， 尽 管 谷 歌 、 雅 虎 以 及 其 他 公司 不 断 地 为 成 百 上 千 万 的 用 户 提供 强大 的 搜索 服 
务 ， 但 是 搜索 仍然 有 很 大 的 提升 空间 。 本 章 将 通过 介绍 一 些 最 有 可 能 革新 已 有 技术 、 带 来 
颠覆 性 创新 的 研究 工作 ， 来 探究 网 络 搜索 的 未 来 。 我 们 会 发 现 历史 总 是 不 断 重 演 ， 正 如 过 
去 的 10 年 间 ， 谷 歌 在 网 络 搜索 上 的 颠覆 性 革新 为 其 带 来 的 莲 勃 发 展 一 样 ， 接 下 来 的 10 
年 ， 新 的 搜索 技术 也 将 展示 出 其 类 似 的 对 搜索 市 场 的 重 整 能 力 。 

即使 现在 这 种 形式 ， 现 代 搜 索引 擎 也 可 以 不 严格 地 看 作 一 种 推荐 系统 ， 他 们 根据 用 户 
的 查询 ， 向 用 户 返回 一 个 推荐 页 面 集 。 但 是 推荐 技术 在 网 络 搜索 中 开始 扮演 越 来 越 重 要 的 
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角色 : 从 众多 辅助 搜索 特征 之 一 ， 慢 慢 地 成 为 解决 核心 搜索 挑战 的 技术 之 一 。 例 如 ， 现 在 
的 搜索 引擎 都 添加 了 查询 推荐 服务 作为 核心 搜索 功能 。 当 用 户 输入 他 们 的 查询 时 ， 类 似 谷 
歌 推荐 的 服务 利用 推荐 技术 进行 识别 、 排 序 并 推荐 之 前 已 经 查询 成 功 的 相关 查询 给 用 户 ， 
具体 参见 文献 [81]j。 在 本 章 中 ， 我 们 将 专注 于 网 络 搜索 中 的 两 类 潜力 巨大 且 非 常 强大 的 新 
思路 一 一 个 性 化 和 协同 ， 你 可 以 从 最 近 的 推荐 系统 研究 [6，53，83，35，89，77] 以 及 本 
书 第 5 章 、 第 4 章 、 第 13 章 中 找到 他 们 的 起 源 。 他 们 质疑 当前 主流 网 络 搜索 的 基本 假设 ， 
并 为 传统 网 络 搜索 引擎 提供 改进 建议 。 第 一 个 基本 假设 主要 关注 当前 主流 网 络 搜索 的 一 刀 
切 特性 两 个 不 同 的 用 户 输入 相同 的 查询 后 ， 或 多 或 少 地 ， 主 流 的 搜索 引擎 都 返回 基本 
一 致 的 结果 列表 ， 而 置 用 户 之 间 的 不 同 偏好 而 不 顾 。 他 们 认为 网 络 搜索 应 该 变 得 更 个 性 
化 ， 以 满足 用 户 的 隐 含 需求 与 偏好 。 我 们 将 介绍 多 种 不 同 的 通过 处 理 不 同 的 用 户 偏 好 与 上 
下 文 信息 来 提高 搜索 体验 ， 实 现 网 络 搜索 个 性 化 的 方法 ， 实 例 参 见 [19，23，33，97，2， 
48，49，108，22，69，86，14，31]。 第 二 个 假设 主要 质疑 网 络 搜 索 的 孤立 (solitary) 特 
性 。 大 部 分 的 网 络 搜索 都 将 搜索 过 程 设 计 为 单个 用 户 与 搜索 引擎 之 间 的 交互 。 但 是 ， 最 新 
的 研究 已 经 表明 ， 很 多 情况 下 的 信息 搜索 都 具有 明显 的 协同 特征 : 成 组 的 搜索 者 (如 朋友 、 
同事 、 同 学 ) 在 搜索 和 分 享 结 果 时 都 通过 多 种 方式 合作 。 我 们 将 介绍 协同 信息 检索 (collab- 
orative information retrieval) 领域 的 最 新 研究 ， 该 领域 致力 于 发 掘 协同 工作 在 各 种 信息 发 
现任 务 中 的 潜能 ， 实 例 参 见 L[70，71，73，72，58，59，94，1]。 

另外 ， 我 们 将 重点 介绍 一 种 结合 了 个 性 化 与 协同 特性 的 新 的 搜索 服务 : 所 谓 的 社交 
搜索 服务 。 其 将 网 络 进化 为 一 个 可 以 促使 用 户 在 搜索 过 程 中 互动 和 协作 的 社交 媒介 ， 以 
便 搜索 者 可 以 从 其 他 想法 类 似 的 用 户 的 偏好 与 经 验 中 受益 。 的 确 ， 这 种 方法 为 搜索 引擎 
的 检索 提供 了 新 的 信息 来 源 : 互动 和 协同 信息 。 而 且 这 些 信息 可 以 用 于 支持 搜索 中 的 推 
荐 : 基于 词 条 的 印证 (term-overlap) 与 链接 信息 的 原始 搜索 结果 ， 可 以 通过 基于 搜索 者 偏 
好 与 活动 的 推荐 结果 得 到 很 好 的 修订 。 这 体现 了 推荐 系统 与 搜索 系统 的 结合 趋势 ， 就 像 
连通 关系 的 引入 带 来 的 搜索 效果 提升 一 样 ， 我 们 有 理由 相信 这 些 新 的 互动 与 偏好 信息 可 
以 促使 搜索 引擎 在 “适当 的 时 间 为 合适 的 用 户 提供 合理 的 结果 ”这 一 目标 上 .进入 全 新 的 发 
展 阶段 。 


18.2 网 络 搜索 历史 简介 


在 介绍 那些 新 兴 的 有 潜力 颠覆 搜索 行业 的 搜索 技术 之 前 ， 回 顾 一 下 网 络 搜索 在 过 去 15 
年 间 的 发 展 还 是 很 有 必要 的 ， 这 可 以 让 我 们 更 好 地 了 解 现代 网 络 搜索 的 演进 。 最 初 的 网 络 
是 没有 搜索 的 。 如 果 你 想 要 访问 某 个 特定 的 网 页 ， 你 可 以 选择 在 你 的 浏览 器 中 直接 输入 
URL, 或 者 通过 雅虎 这 样 的 导航 网 站 作为 人 口 ， 引 导 至 你 想 浏览 的 页 面 。 随 着 网 络 的 不 断 
成 长 、 成 长 、 再 成 长 ， 简 单 的 导航 显然 已 经 无 法 满足 需求 ， 因 此 ， 网 络 搜索 开始 出 现 ， 如 
Lycos, Excite 和 Altavista 等 都 是 一 些 早期 的 搜索 引擎 。 

这 些 搜索 引擎 全 都 基于 20 世纪 70 年 代 便 已 经 出 现 的 称 为 信息 检索 (IR) 的 技术 [104，4]。 
图 18. 1 展示 了 一 个 简化 的 典型 搜索 引擎 原理 图 。 简 单 来 说 ， 早 期 的 搜索 引擎 通过 以 下 方 
式 为 整个 网 络 构建 自己 的 索引 : 疏 取 网 络 上 的 页 面 并 依次 分 析 每 个 页 面 的 内 容 ， 记 录 所 
包含 的 词组 ， 以 及 它们 的 频率 。 当 收 到 查询 请 求 时 ， 搜 索引 擎 对 包含 查询 词组 的 页 面 进 
行 检索 并 排序 ， 然 后 返回 给 用 户 。 在 网 络 搜索 的 初期 ， 索 引 的 大 小 是 竞争 的 重点 ， 索 引 
了 越 多 网 络 页 面 的 搜索 引擎 比 竞争 对 手 具 有 明显 的 覆盖 率 优势 。 搜 索 结 果 的 排序 也 会 得 
到 一 些 关注 ， 但 大 多 数 情况 下 ， 这 些 搜索 引擎 都 将 查询 词组 在 网 页 中 的 出 现 频率 (相对 
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于 将 整个 索引 作为 一 个 整体 ) 作 为 相关 性 的 决定 性 指标 [96]， 因 而 更 倾向 于 选择 独特 查 
询 词 出 现 频率 大 的 页 面 。 这 种 方式 对 于 结构 良好 、 封 闭 式 的 信息 检索 系统 是 合理 的 ， 这 
种 系统 中 信息 检索 专家 可 以 通过 提交 具体 的 、 组 织 良 好 的 查询 获得 合理 的 结果 ,但 是 当 
面 对 大 规模 的 、 具 有 蜡 构 特 性 的 网 络 内 容 或 者 模糊 的 搜索 查询 时 则 表现 灶 糕 。 结 果 就 是 
对 于 大 部 分 的 搜索 用 户 ， 搜 索 体 验 都 很 粮 糕 : 真正 相关 的 结果 被 深 藏 在 一 堆 可 能 看 上 去 
相似 的 结果 列表 中 。 





图 18. 1 典型 网 络 搜索 引擎 功能 模块 图 。 在 离线 处 理 过 程 中 ，- 一 个 页 面 ，P， 通 过 有 息 虫 定位 到 它 的 位 置 ， 
它 的 内 容 一 一 一 堆 词组 汪 ，…， 刀 被 检索 并 构建 索引 。 当 收 到 一 个 搜索 查询 时 ， 引 擎 通过 索引 
检索 到 匹配 查询 词 的 结果 页 面 ，p;，…，p;， 然 后 根据 搜索 引 整 特定 的 排序 方法 对 它们 进行 相 
关 度 排序 ， 组 织 成 为 结果 列表 返回 给 搜索 用 户 

提高 搜索 结果 的 排序 效果 成 为 了 当时 这 些 早期 搜索 引擎 的 首要 挑战 。 当 面 对 这 种 迫切 
需求 时 ， 即 使 构建 最 大 规模 索引 的 角逐 也 必须 做 出 让 步 。 但 是 ， 人 们 很 快 认识 到 那些 单纯 
依靠 页 面 中 的 词 条 数 的 排序 算法 ， 不 论 花 费 多 少时 间 用 于 调整 ， 效 果 都 是 不 明显 的 。 简 单 
地 说 ， 当 采用 对 查询 与 页 面 的 词组 进行 计数 来 计算 得 分 时 ， 很 多 的 网 页 得 分 都 是 相当 的 ， 
但 是 仅 有 少数 页 面 真正 相关 并 且 具 有 权威 性 。 尽 管 词 条 匹配 信息 就 整个 相关 性 而 言 是 有 用 
的 ， 但 是 其 本 身 的 效果 不 显著 。 显 然 ， 在 排序 过 程 中 很 多 重要 的 信息 被 遗漏 了 。 

这 些 遗 漏 的 信息 被 20 世纪 90 年 代 中 期 的 多 个 研究 组 作为 研究 成 果 发 表 出 来 。 包 括 
John Kleinberg[L40] 的 工作 ， 以 及 最 著名 的 、 谷 歌 创始 人 Larry Page 和 Sergey Brin[13] 的 
工作 。 这 些 研 究 者 最 先 开 始 利 用 网 页 之 间 的 链接 关系 ， 用 这 些 信息 评估 网 页 之 间 的 相对 重 
HEE., Kleinberg, Page 和 Brin 将 网 络 作为 一 种 引文 网 络 ( 示 例 见 [60]) 。 与 一 篇 文章 通 
过 一 个 参考 书目 列表 引用 另 一 篇 文章 不 同 ， 在 网 络 上 ， 一 个 页 面 通过 一 个 超 链接 引用 另 一 
个 页 面 。 更 进一步 ， 直 观 上 感觉 ， 一 个 页 面 的 重要 程度 应 该 与 那些 链接 到 它 的 网 页 ， 即 所 
谓 的 反 向 链接 呈 某 种 函数 关系 。 因 此 ， 如 果 多 个 重要 的 页 面 链接 到 某 个 相同 页 面 ， 那 么 这 
个 页 面 也 应 该 被 认为 是 重要 的 。 这 便 是 一 种 全 新 的 评价 某 个 页 面 重要 程度 的 方法 的 基本 出 
发 点 ， 工 作 [40，17] 和 [13] 分 别 发 明了 全 新 的 、 用 于 从 即使 面 对 模糊 的 网 络 搜索 查询 ， 也 
能 识别 出 权威 的 、 相 关 的 页 面 的 算法 。 到 20 世纪 90 年 代 后 期 ，Page 和 Brin 的 被 称 为 
PageRank 的 算法 在 第 一 版 的 谷歌 中 实现 ， 该 算法 结合 了 传统 词组 匹配 技术 与 新 的 链接 分 
析 技 术 ， 可 以 提供 比 当 时 其 他 搜索 引擎 结果 更 客观 优秀 的 搜索 结果 。 其 余 的 ， 正 如 他 们 说 
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18.3 网 络 搜索 的 未 来 


网 络 搜索 无 疑 是 一 个 重要 的 推荐 挑战 。 网 络 的 大 规模 与 增长 的 特性 ， 以 及 内 容 类 型 的 
巨大 差异 性 ， 都 带 来 了 其 特有 的 可 怕 的 信息 检索 挑战 。 同 时 ， 随 着 网 络 用 户 结构 的 不 断 扩 
大 ， 搜 索引 擎 必须 能 够 适应 各 种 不 同类 型 的 用 户 以 及 用 户 的 不 同 搜索 水 平 。 尤 其 对 于 大 多 
数 用 户 的 检索 水 平 ， 都 达 不 到 以 文档 为 中 心 ， 基 于 词 条 的 信息 检索 引擎 对 用 户 的 期 望 ， 而 
这 些 引擎 仍然 是 现代 搜索 技术 的 核心 。 这 些 引 擎 ， 以 及 他 们 所 依赖 的 技术 ， 很 大 程度 上 都 
假设 查询 是 规整 的 、 详 细 的 ， 但 实际 网 络 搜索 的 查询 远 达 不 到 这 样 的 要 求 L36，37，100， 
45]。 事 实 上 ， 大 部 分 的 网 络 搜索 查询 ， 跟 搜索 者 真正 的 信息 需求 之 间 ， 往 往 是 模糊 和 有 
歧义 的 ， 甚 至 查询 中 的 某 些 词 条 在 真正 相关 的 目标 文档 ( 集 ) 中 根本 就 不 出 现 。 

由 于 大 量 的 查询 都 得 不 到 搜索 者 真正 想 要 的 结果 ， 搜 索引 擎 在 这 种 基础 性 的 搜索 体验 
上 还 是 有 很 大 提升 空间 的 。 由 于 网 络 搜索 查询 的 本 质 ， 上 述 问 题 会 继续 存在 ， 至 少 有 一 部 
分 会 如 此 ， 因 为 指望 用 户 的 搜索 技能 在 短 时 间 内 得 到 提升 基本 不 大 可 能 。 因 此 ， 研 究 者 为 
了 提高 整体 的 搜索 体验 ,已 经 开始 从 两 个 方向 进行 探索 研究 。 一 个 普遍 的 观点 认为 网 络 搜 
索 应 该 变 得 更 加 个 性 化 : 用 户 的 额外 信息 ， 如 用 户 的 偏好 以 及 当时 的 上 下 文 信息 ， 应 该 用 
于 构造 更 个 性 化 的 搜索 方式 ， 对 搜索 结果 进行 选取 与 排序 ， 以 得 到 更 好 的 符合 用 户 偏 好 和 
上 下 文 的 搜索 结果 (参见 [86，14，31，22，2，48])。 男 一 种 观点 是 网 络 搜索 可 以 变 得 更 
协同 : 允许 用 户 群 组 之 间 在 搜索 时 进行 ( 隐 式 或 者 显 式 的 ) 合 作 ( 参 见 L[70，71，73，72， 
58, 59, 94, 11), 

在 接 下 来 的 章节 中 ， 我 们 会 探究 这 些 研究 领域 ,介绍 一 些 试图 将 静态 的 ( 非 个 性 化 
的 )、 孤 立 的 ( 非 协 作 的 ) 主 流 搜索 引擎 改造 为 更 加 个 性 化 (18. 3.1 节 ) 或 更 加 可 协作 
(18. 3. 2 节 ) 的 搜索 服务 的 开创 性 工作 。 这 些 开创 性 工作 借鉴 了 推荐 系统 、 用 户 属性 、 计 
算 机 支持 下 的 协同 工作 研究 (参见 [84，41，89，35，52])。 我 们 也 将 重点 介绍 一 些 力求 将 
这 两 点 同时 结合 以 开创 新 一 代 个 性 化 与 可 协作 搜索 服务 的 研究 工作 。 在 本 章 余下 部 分 中 ， 
我 们 将 这 种 混合 搜索 服务 称 为 社交 搜索 ， 并 对 社交 搜索 的 两 种 不 同 实现 方式 分 别 详细 介绍 
两 个 案例 研究 。 


18.3.1 个 性 化 网 络 搜索 


许多 推荐 系统 的 设计 目标 就 是 向 用 户 做 出 与 他 们 特定 环境 或 者 个 人 偏好 相 吻 合 的 推 
荐 ， 比 如 ， 推 荐 系统 帮助 用 户 发 掘 如 新 闻 文章 [8，9，4]、 书 籍 [46]、 电 影 [54，27，42] 
甚至 要 买 的 产品 [83，74，76，51，75，20] 等 和 个 人 相关 的 信息 。 而 推荐 技术 在 网 络 搜索 
中 的 应 用 可 以 (使 搜索 系统 ) 摆 脱 主流 搜索 引擎 中 传统 的 一 刀 切 方式 。 当 我 们 想 要 实现 个 性 
化 搜索 体验 时 ， 有 两 个 关键 点 : 首先 ， 我 们 需要 理解 搜索 者 的 需求 (用 档案 记录 用 户 信息 ; 
然后 ， 我 们 必须 能 够 使 用 这 些 用户 信 息 来 影响 搜索 引擎 的 输出 ， 比 如 ， 根 据 用 户 信息 对 搜 
索 结 果 重 排序 ， 或 者 ， 影 响 网 络 搜索 体验 的 其 他 方面 。 

为 了 更 好 地 理解 这 些 研 究 成 果 ， 我 们 有 必要 从 两 个 重要 的 维度 来 考虑 个 性 化 网 络 搜 
索 。 一 方面 ， 我 们 可 以 从 获得 的 用 户 信息 的 性 质 出 发 : 一 些 方法 专注 于 从 用 户 当前 的 搜索 
上 下 文中 获取 短期 用 户 信息 ( 如 [86，14，31]) ， 而 另外 一 些 方法 则 适用 于 从 一 个 时 间 段 内 
用 户 的 偏好 来 获取 长 期 (long-term) 的 用 户 信息 (如 [22，2，48)。 另 一 方面 ， 可 以 从 搜索 阶 
段 对 这 些 用 户 信息 的 处 理 方式 考虑 : 我 们 可 以 有 效 地 区 分 那些 以 单个 目标 用 户 的 特定 用 户 
信息 为 导向 的 方法 (如 [15，89，38，43]) 和 那些 协同 的 方法 ， 也 就 是 说 ， 他 们 以 用 户 组 的 
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用 户 信息 为 导向 (如 [46，85，41，35，90]) 。 

通常 来 说 ， 用 户 信息 可 以 采用 两 种 方式 获得 。 显 式 个 性 化 (explicit profiling) 通 过 直接 
向 用 户 询问 不 同类 型 的 偏好 信息 : 从 类 别 偏好 [22，48] 到 简单 的 结果 评分 [2]j。 与 之 相反 ， 
隐 式 个 性 化 (implicit profiling) 技 术 更 倾向 于 通过 监控 用 户 行为 来 推断 偏好 信息 ， 而 不 干扰 
用 户 的 搜索 过 程 ， 如 [22，47，69]。 

通过 显 式 个 性 化 ， 用 户 自 己 完成 个 性 化 过 程 : 或 通过 预先 设置 搜索 偏好 ， 或 提供 如 对 
返回 搜索 结果 进行 评分 等 个 性 化 相关 反馈 。Chirita 等 [22] 就 使 用 了 用 户 通过 以 下 方式 定义 
的 独立 用 户 信息 : 搜索 者 利用 ODPs 网 络 目录 分 类 体系 ， 根 据 每 个 结果 的 ODP 分 类 与 用 
户 信 息 之 间 的 距离 对 搜索 结果 进行 重新 排序 。 他 们 试验 了 多 种 不 同 的 距离 度量 方法 后 ， 公 
布 了 在 线 用 户 评 估 的 新 发 现 : 他 们 的 个 性 化 方法 可 以 提供 比 标准 谷歌 搜索 更 相关 的 结果 排 
序 。 采 用 这 种 基于 ODP 分 类 方法 的 不 足 之 一 是 仅 有 一 小 部 分 的 网 络 内 容 是 采用 ODP 分 类 
的 ， 返 回 的 搜索 结果 中 还 有 太 多 的 内 容 因 为 没有 这 种 分 类 信息 而 无 法 进行 重 排序 。Ma 等 
[48J] 采 用 一 种 类 似 的 方法 ， 虽然 他 们 的 用 户 信 息 同样 是 显 式 地 通过 ODP 类 别 信息 进行 表 
示 的 ， 但 是 他 们 对 搜索 结果 的 重 排 基 于 的 是 结果 页 面 内 容 与 用 户 个 人 ODP 目录 分 类 信息 
之 间 的 余弦 相似 度 。 通 过 这 种 方式 ， 搜 索 结 果 本 身 不 再 需要 进行 ODP 分 类 。 

与 上 述 方法 不 同 ，ifWeb[2] 通 过 一 种 对 结构 化 要 求 更 低 的 方式 构建 用 户 信 息 : 他 们 将 
用 户 为 了 表达 他 们 的 特定 信息 需求 而 提供 的 关键 字 、 自 由 文本 描述 ， 以 及 示例 页 面 ， 保 存 
为 一 个 加 权 语 义 概念 网 络 (weighted semantic network of concept) 。ifWeb 同时 还 利用 用 户 
对 结果 的 评分 这 种 显 式 的 相关 性 反馈 来 精炼 和 更 新 他 们 的 。Wifs 系统 [55] 也 采用 了 类 似 
的 方法 ， 该 系统 从 一 堆 词 组 中 选择 一 些 词组 作为 用 户 的 用 户 信息 初始 值 ， 并 通过 之 后 用 户 
提供 的 查看 过 的 文档 信息 来 改善 这 些 信息 。 采 用 这 些 显 式 方法 的 主要 问题 是 大 部 分 的 用 户 
都 不 愿意 参与 提供 这 些 反 馈 [16]。 此 外 ， 搜 索 者 也 许 会 发 现 很 难 对 自己 的 信息 需求 进行 分 
类 ， 并 一 开始 就 提供 精确 的 个 人 偏好 。 

另 一 种 可 能 更 成 功 的 方式 是 隐 式 地 推断 用 户 的 偏好 ( 隐 式 个 性 化 ) 。 在 工作 [22] 中 ， 
Liu 等 [47] 也 使 用 ODP 的 层次 类 别 表示 用 户 信息 ， 但 是 在 这 个 工作 中 ， 这 些 类 别 信息 是 基 
于 用 户 之 前 的 搜索 行为 ， 比 如 ， 之 前 提交 的 查询 以 及 选择 的 搜索 结果 文档 ， 而 自动 获取 
的 。 很 多 算法 已 经 被 设计 用 于 将 这 些 搜索 行为 映射 为 ODP 类 别 信息 ， 包 括 基 于 最 小 二 乘 
法 线性 拟 合 (Linear Least Squares Fit, LLSF) 的 方法 [107]，Rocchio 相关 性 反馈 算法 
(Rocchio relevance feedback algorithm)[78], WRk 近邻 算法 (kNN)[28]。 在 另 一 种 与 之 
相关 的 方法 中 ，[L103] 使 用 统计 语言 模型 ， 从 这 些 长 期 的 搜索 历史 中 挖掘 上 下 文 信息 ， 建 
立 基 于 语言 模型 的 用 户 信息 。[69] 也 同样 基于 历史 行为 推断 用 户 偏好 ， 但 是 他 们 采用 的 是 
利用 访问 过 的 页 面 的 浏览 器 缓存 ， 来 推断 用 户 可 能 感 兴趣 的 主观 领域 。 这 些 主观 领域 或 者 
类 别 信息 ， 被 合并 人 一 个 层次 化 用 户 信息 中 。 在 这 个 层次 化 用 户 信息 中 ， 每 一 种 类 型 都 根 
据 用 户 在 查看 这 个 类 别 相 关 的 页 面 时 所 花费 的 时 间 长 短 赋予 权重 。 

以 上 的 例子 都 是 使 用 长 期 用 户 信息 long-term user profile) 来 试图 捕获 用 户 在 一 段 时 
间 内 ， 至 少 在 超过 一 个 搜索 会 话 的 时 间 内 的 用 户 偏 好 。 但 是 我 们 还 可 以 选择 短期 用 户 信 
息 ， 比 如 ， 一 个 典型 的 做 法 就 是 选择 与 当前 搜索 任务 相关 的 上 下 文 信息 。 举 例 来 说 ， 
UCAIR 系统 [86] 利 用 最 近 提 交 的 查询 与 选择 的 结果 建立 短期 用 户 信息 ， 用 于 个 性 化 当前 
正在 进行 的 搜索 任务 。 在 初始 化 一 个 新 的 搜索 会 话 时 ， 系 统 将 为 用 户 与 他 们 当前 的 信息 需 
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求 建立 新 的 用 户 信 息 。 类 似 地 ，Watson[14] 和 IntelliZap[31] 都 从 当前 的 上 下 文 信息 建立 
了 短期 用 户 信息 。Watson 通过 识别 用 户 正 在 编辑 的 本 地 文档 或 者 正在 浏览 的 页 面 中 信息 
量 大 的 词 条 ， 利 用 这 些 词组 修改 用 户 的 搜索 查询 来 获得 个 性 化 的 结果 。IntelliZap HAP 
首先 从 他 们 正在 浏览 的 文档 中 选择 一 个 文本 查询 作为 搜索 初始 值 ， 然 后 在 搜索 系统 的 引导 
下 ， 从 该 文档 中 选择 相近 的 附加 词 对 搜索 查询 进行 扩展 。 在 这 些 例 子 中 ， 引 导 搜 索 结 果 个 
性 化 的 用 户 信息 记录 的 是 与 用 户 相关 的 、 及 时 甚至 临时 的 信息 需求 。 

这 些 用 户 信息 与 (或 ) 上 下 文 信息 的 可 用 性 是 (搜索 ) 个 性 化 的 前 提 ， 人 们 也 已 经 开发 了 
各 种 各 样 的 技术 来 利用 这 些 信息 影响 搜索 体验 的 各 个 方面 。 这 些 技术 不 仅 限 于 用 来 影响 搜 
索 结 果 的 检索 与 排序 ， 比 如 ， 事 实 上 已 经 有 人 研究 如 何 利用 这 些 用 户 信 息 来 影响 整个 网 络 
搜索 流程 中 的 许多 其 他 阶段 ， 如 对 原始 网 页 的 抓 取 与 索引 [32，44，34，29]， 以 及 查询 生 
成 L3，7，56]。 比 如 ， 一 个 常用 的 基于 用 户 信 息 个 性 化 搜索 结果 的 方式 就 是 利用 这 些 用 户 
信息 重 写 、 细 化 或 者 扩展 原始 搜索 查询 ， 使 得 系统 可 以 返回 能 更 加 体现 搜索 兴趣 与 上 下 文 
的 特定 结果 。 再 如 ，Loutrika 和 Ioannidis[43] 发 明了 一 种 他 们 称 为 QDP( 查 询 词 消 歧 及 个 
性 化 ，Query Disambiguation and Personalization) 的 算法 ， 用 于 根据 词 条 间 的 加 权 关 系 
(weighted relationships between terms) 所 表示 的 用 户 信 息 来 扩展 用 户 提交 的 查询 。 这 些 关 
系 表现 为 词组 间 的 各 种 操作 关系 : 如 连接 (conjunction)、 分 裂 (disjunction)、 反 义 (nega- 
tion)、 置 换 (substitution)， 所 以 实际 效果 就 是 用 户 信 息 提 供 了 一 组 个 性 化 查询 重 写 规则 ， 
用 于 在 将 提交 上 来 的 查询 提交 给 搜索 引擎 之 前 对 查询 进行 重 写 。Croft 等 [26] 描 述 了 个 性 
化 语言 模型 可 以 用 于 用 户 信息 ， 以 提供 查询 扩展 与 相关 反馈 。 从 与 个 性 化 搜索 高 度 相关 的 
反馈 立场 来 看 ， 在 用 短期 的 、 基 于 会 话 的 用 户 信息 去 扩展 查询 和 消除 歧义 的 领域 ， 也 做 了 
大 量 的 研究 工作 [82]。 从 这 个 角度 来 说 ， 这 些 方法 与 其 说 是 针对 个 性 化 搜索 本 身 ， 还 不 如 
说 是 在 于 提高 搜索 在 一 次 独立 搜索 会 话 中 的 表现 ， 而 且 其 中 的 许多 方法 也 可 以 用 于 指引 更 
长 期 个 性 化 搜索 用 户 信息 。 

但 是 ， 利 用 用 户 信 息 进行 个 性 化 搜索 最 流行 的 方式 可 能 还 是 直接 影响 搜索 结果 的 排 
序 。 例 如 ，Jeh 和 Widom[ 38] 通 过 引入 一 个 个 性 化 的 PagaRank[13]， 设 定 独立 于 搜索 的 
先 验 条 件 ， 对 网 页 的 结果 使 用 用 户 信息 进行 干预 排序 。 这 些 用 户 信息 由 一 些 通 过 用 户 显 
式 选 取 的 、 具 有 高 PageRank 值 的 偏好 页 面 (preferred page) 集 构成 ， 这 些 页 面 被 用 于 为 
任意 页 面 计算 一 个 特定 PageRank fA: 该 页 面 与 这 些 高 得 分 的 偏好 页 面 之 间 的 相关 性 。 
Chirita 等 [23] 在 这 个 思想 基础 上 ， 通 过 分 析 搜 索 者 的 书签 页 面 与 历史 网 上 冲浪 行为 自动 
选择 这 些 偏 好 页 面 ， 利 用 一 个 HubFinder 算法 ， 找 到 适合 驱动 这 种 特定 PageRank 算法 
的 相关 高 PageRank 得 分 页 面 。 这 两 种 方法 都 基于 从 用 户 浏览 历史 中 获得 的 长 期 用 户 
信息 。 

Change 等 [19] 在 Kleinberg 的 HITS[L39] 排 序 算 法 基础 上 设计 了 一 个 个 性 化 版 本 。 他 
们 的 方法 显 式 或 隐 式 地 从 搜索 者 获得 短期 反馈 ， 构 建 一 个 由 个 性 化 权威 列表 组 成 的 用 户 信 
息 ， 用 户 信息 中 的 权威 列表 可 以 用 于 影响 HITS 算法 以 实现 对 搜索 结果 的 个 性 化 排序 。 使 
用 了 计算 机 科学 研究 论文 作为 语料库 的 实验 结果 显示 ， 即 使 只 有 极 少 的 搜索 者 反馈 ， 个 性 
化 的 HITS 算法 也 能 够 显著 改善 符合 搜索 者 偏好 的 结果 排序 。 

另 一 种 流行 的 基于 排序 的 方法 是 ， 不 调用 搜索 引擎 的 内 部 运行 ， 仅 利用 用 户 的 偏好 对 
一 些 底层 的 (underlying)、 通 用 的 网 络 搜索 引擎 返回 的 结果 进行 重 排序 。Speretta 和 
Guach[97] 通 过 记录 用 户 的 查询 以 及 在 谷歌 返回 的 结果 中 选择 的 结果 片段 来 建立 个 人 ， 同 
时 用 户 选 择 的 结果 片段 被 参照 一 个 概念 层次 结构 分 类 为 一 些 概念 的 加 权 组 合 。 之 后 所 有 来 
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自 谷歌 搜索 的 结果 都 根据 每 条 结果 与 搜索 者 用 户 信息 中 的 层次 概念 之 间 的 相似 度 进 行 重新 
排序 。Rohini 和 Varma[79] 也 提出 了 一 种 利用 协同 过 滤 技 术 对 来 自 一 个 底层 网 络 搜索 引擎 
的 结果 进行 重 排序 的 个 性 化 搜索 方法 ， 该 方法 利用 的 个 性 化 用 户 信息 采用 隐 式 生成 。 

上 述 所 有 技术 都 专注 于 利用 单一 的 用 户 信息 (目标 搜索 者 的 偏好 ) 来 个 性 化 用 户 的 搜索 
体验 。 在 推荐 系统 研究 中 ， 常 用 的 方法 是 利用 几 组 相关 的 用 户 信息 为 一 个 目标 个 体 生成 推 
荐 。 比 如 ， 有 名 的 协同 过 滤 (collaborative filtering) 按 术 就 是 显 式 地 利用 一 组 与 目标 用 户 相 
似 的 用 户 的 偏好 来 为 目标 用 户 生 成 推荐 [77，85，46]， 参 见 [35，52] 以 及 第 21 章 。 类 似 
的 思想 也 已 经 开始 影响 网 络 搜索 ， 事 实 上 ， 我 们 将 在 18. 4 节 介 绍 一 种 利用 整个 群体 用 户 
偏好 的 方法 ， 虽 然 该 方法 在 形式 上 用 的 整个 群体 的 用 户 信息 而 不 是 一 组 独立 用 户 的 用 户 信 
息 ， 具 体 参 见 [92，90]。Sugiyama 等 [101] 提 出 了 一 种 方法 ， 所 使 用 的 长 期 用 户 信 息 就 是 
通过 相似 用 户 生 成 的 ， 这 些 相 似 用 户 则 是 利用 改造 的 协同 过 滤 算 法 根据 用 户 的 浏览 历史 而 
得 到 的 。 这 个 想法 就 是 在 过 去 关心 了 相似 的 查询 且 选 择 了 相似 结果 的 搜索 者 可 以 从 他 们 共 
享 的 搜索 偏好 中 受益 。Sun 等 [102] 提 出 了 一 种 类 似 的 、 基 于 协同 过 滤 算 法 分 析 相 关 用 户 、 
查询 与 结果 点 击 来 个 性 化 网 络 搜索 结果 的 、 名 叫 CubeSVD 的 方法 。 这 两 种 方法 都 通过 识 
别 与 当前 搜索 者 相似 的 搜索 用 户 来 为 单个 用 户 建立 更 加 综合 性 的 用 户 信 息 。 最 新 的 研究 
[12j 提 出 了 一 种 点 对 点 的 方法 来 个 性 化 网 络 搜索 ， 采 用 的 同样 是 在 结果 推荐 中 利用 相似 用 
户 的 用 户 信息 。 每 个 搜索 者 都 根据 之 前 的 查询 以 及 结果 选择 建立 用 户 信息 (同样 还 是 长 期 
用 户 信息 )。 在 收 到 一 个 新 的 目标 查询 后 ， 推 荐 仍然 由 用 户 自身 的 个 人 用 户 信 息 驱 动 ， 但 
是 该 查询 同时 也 通过 点 对 点 搜索 网 络 进行 传播 ， 使 得 连接 的 用 户 可 以 基于 他 们 自己 之 前 的 
搜索 行为 推荐 相关 结果 。 推 荐 结果 根据 与 目标 查询 的 相关 性 以 及 目标 用 户 与 相关 节点 的 信 
任 关系 强度 进行 聚合 和 排序 ， 读 者 可 以 阅读 [63，65，64，66，67，62] 和 第 20 章 了 解 最 
近 的 基于 信任 的 推荐 技术 。 


18.3.2 协同 信息 检索 


最 近 一 些 关于 特定 信息 探索 任务 ， 如 军事 命令 与 控制 任务 或 者 医疗 任务 的 研究 已 经 有 
明显 的 证 据 表 明 ， 当 信息 在 团队 成 员 之 间 共 享 时 ， 搜 索 类 型 的 任务 也 可 以 协作 [70，71， 
73，72j。 此 外 ，[57] 的 研究 更 突出 显示 了 更 多 通用 网 络 搜索 的 固有 协作 属性 。 例 如 ， 在 
一 项 有 超过 200 名 调查 对 象 的 调研 中 ， 有 明确 迹象 表明 搜索 行为 出 现 了 协作 。 超 过 90 96 RS 
受 访 者 表示 ， 他 们 在 搜索 过 程 层 面 上 频繁 地 参与 协作 。 比 如 ，87 闻 的 受 访 者 表示 有 过 “ 背 
后 搜索 (back-seat searching)? 行 为 ， 即 他 们 站 在 搜索 者 的 背后 向 搜索 者 提供 替代 查询 建 
议 。 还 有 30% 的 受 访 者 表示 参与 过 搜索 协调 活动 ， 即 通过 即时 通信 协调 搜索 。 此 外 ，96% 
的 用 户 表示 有 过 搜索 产 出 物 层面 的 协作 ， 即 搜索 的 结果 。 比 如 ，86% 的 受 访 者 在 搜索 过 程 
中 ， 通 过 电子 邮件 共享 过 自己 找到 的 搜索 结果 。 因 此 ， 尽 管 现在 主流 的 搜索 引擎 没有 明确 
的 协作 特征 ， 但 是 有 明确 的 证 据 显 示 用 户 在 搜索 中 通过 多 种 不 同形 式 隐 式 地 进行 了 协作 ， 
虽然 根据 [57] 的 报告 ， 这 些 协作 “变通 ”往往 是 令 人 泪 丧 和 低 效 的 。 自 然 地 ， 这 促使 研究 人 
员 考 虑 在 未 来 版 本 的 搜索 引擎 中 支持 不 同类 型 的 协作 。 

由 此 产生 的 协作 信息 检索 方法 可 以 从 两 个 重要 维度 进行 区 分 : 时 间 一 一 即 同步 (syn- 
chronous) 还 是 异步 (asynchronous) 搜 索 一 一 和 位 置 搜索 者 是 本 地 的 (co-located) 还 是 
远程 的 (remote) 。 本 地 系统 为 单个 地 点 ， 最 经 典 的 就 是 一 台 PC 的 多 个 用 户 提 供 协 作 搜 索 
体验 (参见 [1，87])， 而 远程 系统 则 允许 搜索 者 在 不 同 的 地 点 使 用 多 台 设 备 进行 搜索 ， 参 
见 [58，59，94]。 前 者 显然 可 以 通过 利用 本 地 搜索 (co-located) 具 有 的 面对面 本 质 特点 ， 





第 18 章 ”个 性 化 Web 搜 索 中 的 群体 、 协 作 与 推荐 系统 391 


大 大 地 方便 人 员 之 间 的 直接 协作 ， 而 后 者 则 为 协作 搜索 提供 了 更 大 的 机 会 。 另 外 ， 同 步 方 
法 的 特点 是 系统 通过 广播 “呼叫 搜索 ”(call to search) ， 要 求 特定 的 参与 者 在 一 个 精确 设 定 
的 时 间 段 内 参与 一 个 精确 定义 的 搜索 任务 ， 示 例 参 见 [87]。 与 之 相 比 ， 异 步 方法 的 特点 是 
搜索 任务 更 松散 灵 侨 ， 同 时 提供 更 加 灵活 的 协作 方式 ， 使 得 不 同 的 搜索 者 可 以 在 一 段 时 间 
内 参与 演变 中 的 搜索 会 话 ， 示 例 参见 [58，92]。 

工作 [1j 给 出 了 一 个 关于 采用 本 地 、 同 步 方法 实现 协同 网 络 搜索 的 很 好 的 例子 。 他 们 的 
CoSearch 系统 设计 用 于 提高 那些 计算 资源 有 限 的 用 户 的 搜索 体验 ; 比如， 学 校 里 同时 使 用 一 
台 PC 的 一 组 学 生 。CoSearch 是 专门 为 利用 周边 可 用 的 设备 (如 移动 电话 、 闲 置 鼠 标 (extra 
mice) 等 ) 进 行 分 布 式 控制 与 工作 分 解 ， 同 时 保证 团体 的 群体 意识 与 沟通 而 设计 的 。 例 如 ， 在 
一 个 一 组 用 户 通过 仅 有 一 台 PC， 但 有 多 个 鼠标 进行 协作 的 场景 中 ，CoSearch 支持 一 个 主 搜 
索 者 (a lead searcher) 或 者 驱动 者 (可 以 操作 键盘 的 人 )， 其 他 用 户 则 扮演 搜索 观察 者 (observ- 
ers), 。 前 者 完成 基本 的 搜索 任务 ， 但 是 所 有 用 户 可 以 使 用 返回 的 结果 ， 独 立地 选择 链接 ， 将 
感 兴趣 的 页 面 加 入 一 个 页 面 队列 以 供 进一步 回顾 。CoSearch 接口 同时 还 为 用 户 提供 多 种 方式 
对 页 面 添加 笔记 。 感 兴趣 的 页 面 可 以 保存 下 来 ， 同 时 用 户 在 协作 时 可 以 通过 URL 以 及 对 保 
存 页 面 的 笔记 生成 搜索 总 结 。 如 果 观 察 者 可 以 使 用 手机 ，CoSearch 通过 蓝牙 连接 为 用 户 提 供 
一 系列 扩展 功能 接口 以 支持 丰富 的 独立 功能 。 通 过 这 种 方式 ， 观 察 者 可 以 下 载 搜索 结果 到 他 
们 的 手机 ， 获 取 结 果 队 列 ， 添 加 页 面 到 结果 队列 ， 以 及 与 小 组 分 享 新 页 面 。 

CoSearch 的 目的 是 演示 在 资源 有 限 的 环境 中 进行 高 效 的 网 络 搜索 协作 。 其 重点 很 大 
程度 是 把 搜索 劳动 进行 分 工 ， 但 同时 保持 搜索 者 之 间 的 交流 沟通 ， 而 且 在 线 用 户 调查 也 显 
示 ，CoSearch 在 这 方面 是 成 功 的 [1]。 文 献 [88j 的 工作 在 思想 上 与 CoSearch 相关 ， 但 侧重 
于 使 用 桌面 计算 环境 进行 图 像 搜 索 的 任务 ， 这 种 情况 非常 适合 本 地 用 户 共同 搜索 时 的 协 
作 。 初 步 的 研究 再 次 表明 了 这 种 方式 在 提高 整体 搜索 的 效率 和 协作 上 是 有 效 的 ， 至 少 在 一 
些 特定 类 型 的 信息 获取 任务 上 有 效 的 ， 如 图 片 搜索 。 文 献 [87j 列 举 了 一 系列 不 同形 式 的 同 
步 搜 索 活动 ， 在 这 些 活动 中 ， 移 动 设备 作为 主要 的 搜索 设备 可 以 通过 远程 形式 进行 同步 协 
作 搜 索 。iBinggo 系统 允许 一 组 用 户 通 过 每 人 使 用 一 个 ipod touch 设备 作为 主要 的 搜索 与 
反馈 设备 (尽管 传统 的 PC 似乎 同样 适用 ) 在 一 个 图 片 搜索 任务 中 进行 协作 。 有 趣 的 是 ， 
CoSearch 的 重点 在 很 大 程度 是 对 搜索 劳动 的 分 工 和 对 沟通 的 支持 ， 而 iBingo 则 使 以 下 情 
况 成 为 可 能 ， 即 通过 任何 独立 搜索 者 的 相关 反馈 为 其 他 用 户 提供 好 处 。 具 体 来 说 ，iBingo 
协作 引擎 使 用 活动 中 的 每 个 用 户 的 信息 来 鼓励 其 他 用 户 探索 不 同 的 信息 路 径 以 及 信息 空间 
的 不 同方 面 。 通 过 这 种 方式 ， 用 户 正 在 进行 的 活动 可 以 影响 小 组 未 来 的 搜索 ， 在 一 定 意义 
上 ， 搜 索 过 程 就 通过 小 组 的 搜索 活动 被 “个 性 化 ”了 。 

远程 搜索 协作 (异步 或 者 同步 ) 是 SearchTogether 的 目标 ， 它 允许 多 组 搜索 者 在 搜索 定 
位 某 个 特定 主题 的 信息 时 参与 扩展 共享 搜索 会 话 ; 参见 文献 [58]。 简 单 地 说 ，SearchTo- 
gether 系统 允许 用 户 参加 共享 搜索 会 话 并 邀请 其 他 用 户 加 入 这 些 会 话 。 每 个 用 户 可 以 独立 地 
就 一 个 特定 主题 搜索 信息 ， 但 系统 提供 的 功能 可 以 允许 个 人 用 户 通过 推荐 与 评价 具体 的 结果 
来 与 会 话 中 的 其 他 成 员 分 享 他们 的 发 现 。 反 过 来 说 ，SearchTogether 通过 允许 搜索 者 邀请 其 
他 人 加 入 特定 的 搜索 任务 、 人 允许 合作 搜索 者 通过 多 画面 形式 的 结果 接口 同步 查看 每 个 搜索 者 
的 结果 实现 同步 协作 搜索 。 与 上 述 的 CoSearch 一 样 SearchTogether 的 一 个 关键 设计 目标 是 
支持 对 复杂 、 无 限制 的 搜索 任务 进行 分 工 。 此 外 ， 该 工作 的 另 一 个 关键 特征 是 其 可 以 通过 从 
接口 级 别 降低 搜索 协作 的 开销 实现 在 一 个 团队 成 员 之 间 建 立 共 享 意识 的 能 力 。SearchTogether 
通过 包含 一 系列 从 消息 集成 、 查 询 历史 到 最 近 查 询 推 荐 的 功能 ， 实 现 了 上 述 目 标 。 
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总 体 来 说 ， 到 目前 为 止 ， 我 们 介绍 过 的 所 有 协作 信息 检索 系统 都 主要 集中 在 支持 劳动 
分 工 协 作 以 及 共享 意识 方面 ， 并 独立 于 底层 的 搜索 过 程 。 简 而 言 之 ， 这 些 系统 都 假定 底层 
搜索 可 用 ， 然 后 提供 一 个 协作 接口 高 效 地 直接 引入 搜索 结果 并 允许 用 户 分 享 这 些 结果 。 就 
像 文献 [68] 中 提 到 的 ， 从 被 通知 参与 协作 活动 的 搜索 者 都 必须 独立 地 检查 和 理解 这 些 活 
动 ， 以 融合 他 们 自己 与 合作 搜索 者 的 活动 这 个 意义 上 来 说 ， 这 些 方法 的 一 个 主要 局 限 就 在 
于 协作 都 仅 限 于 系统 提供 的 那些 接口 。 因 此 ， 文 献 [68] 的 工作 介绍 了 一 种 与 底层 搜索 引擎 
资源 联系 更 紧密 的 协作 方法 ， 使 得 协作 搜索 者 通过 不 同方 式 参与 的 活动 可 以 直接 影响 搜索 
引擎 本 身 的 操作 。 比 如 ， 中 介 技 术 (mediation techniques) 用 于 优先 选择 至 今 还 未 出 现 的 文 
档 ， 而 查询 推荐 技术 则 用 于 为 进一步 的 搜索 探索 提供 可 选 途径 。 


18.3.3 向 社交 搜索 前 进 


到 目前 为 止 ， 我 们 分 别 集中 讨论 了 以 解决 传统 网 络 搜索 核心 问题 为 动机 的 网 络 搜索 与 
信息 发 现 领域 的 两 个 互补 研究 分 支 。 研 究 者 通过 质疑 主流 网 络 搜索 引擎 一 刀 切 的 特性 ， 提 
出 了 更 加 个 性 化 的 网 络 搜索 技术 ; 最 近 的 研究 通过 质疑 搜索 主要 是 一 个 孤立 的 过 程 这 一 假 
设 ， 突 出 展现 了 很 多 搜索 场景 的 固有 协作 属性 。 

到 目前 为 止 ， 这些 不 同方 向 的 研究 根据 动机 和 目标 不 同 而 分 类 。 比 如 ， 在 个 性 化 搜索 
领域 ， 大 部 分 都 是 以 产生 更 针对 个 人 搜索 者 需求 的 结果 列表 为 主导 ， 而 协作 信息 检索 则 集 
中 于 支持 多 组 搜索 者 进行 搜索 劳动 分 工 和 提高 合作 搜索 者 之 间 的 共享 意识 。 但 是 ， 这 两 个 
研究 团体 都 通过 推荐 系统 领域 这 个 共同 点 联系 在 一 起 ， 同 时 ， 推 荐 系统 的 视角 为 这 两 个 不 
同 分 支 的 共同 研究 提供 了 可 能 。 在 接 下 来 的 内 容 中 ， 我 们 将 介绍 两 个 试图 将 这 两 种 技术 结 
合 以 得 到 既 个 性 化 又 可 协作 的 搜索 技术 的 相关 案例 研究 。 结 果 就 是 得 到 一 个 更 加 可 协 
作 一 一 每 个 案例 都 假设 有 成 组 的 搜索 者 参与 一 一 并 且 更 个 性 化 ， 尽 管 是 在 组 这 个 层次 而 不 
是 个 人 搜索 者 层次 的 网 络 搜索 。 这 两 个 案例 研究 都 将 介绍 远程 、 异 步 形 式 的 协作 网 络 搜 
索 ， 同 时 将 总 结 一 些 最 近 的 在 线 用 户 调查 的 结果 ， 来 强调 他 们 为 终端 用 户 带 来 的 潜在 好 
处 。 在 每 个 例子 中 ， 我 们 都 将 介绍 推荐 技术 在 增加 传统 搜索 结果 列表 价值 上 所 起 到 的 中 心 
角色 作用 。 例 如 ， 我 们 将 介绍 群体 或 者 组 成 员 的 偏好 与 活动 是 如 何 用 于 促进 在 传统 搜索 结 
果 列 表 中 增加 推荐 搜索 结果 的 。 


18.4 案例 研究 1: 基于 群体 的 网 络 搜索 


在 第 一 个 案例 中 ， 我 们 回顾 最 近 基 于 群体 的 网 络 搜索 工作 。 其 中 ， 有 相似 想法 的 用 户 
的 群体 搜索 活动 被 用 于 改善 主流 搜索 引擎 的 结果 ， 以 提供 更 符合 以 群体 为 导向 的 结果 列 
表 ; 参看 文献 [ 91，92]。 它 可 能 包括 清晰 界定 或 专门 的 群体 。 我 们 的 目标 是 利用 该 群体 搜 
索 行 为 中 查询 的 重复 性 和 选择 的 规律 性 来 作为 推荐 结果 的 来 源 。 在 本 案例 研究 中 ， 我 们 描 
述 并 评估 该 网 络 搜索 方法 的 一 种 具体 实现 ， 该 实现 已 用 于 主流 搜索 引擎 ， 如 Google. 


18.4.1 搜索 群体 中 的 重复 性 和 规律 性 


在 很 多 场景 中 ， 搜 索 可 以 视 为 群体 推荐 活动 。 例 如 ， 同 一 公司 的 员工 可 以 充当 一 种 有 
着 重合 信息 需求 的 搜索 群体 。 类 似 地 ， 同 一 班级 的 学 生 也 可 以 作为 一 个 搜索 群体 ， 因 为 他 
们 都 搜索 与 他 们 课堂 作业 相关 的 信息 。 同 一 主题 网 站 的 访客 (如 野外 门户 网 站 或 驾车 门户 
网 站 ) 将 倾向 于 分 享 某 些小 兴趣 并 常 使 用 网 站 的 搜索 工具 来 寻找 相关 信息 。 当 然 ， 社 交 网 
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络 网 站 的 朋友 群 也 可 以 作为 有 共同 兴趣 的 群体 。 

我 们 之 所 以 对 这 些 新 兴 的 搜索 群体 感 兴趣 ， 是 因为 我 们 相信 ， 这 些 群 体 成 员 的 搜索 模 
式 之 间 在 很 大 可 能 上 存在 着 相似 性 。 例 如 ， 图 18.2 展现 了 对 当地 软件 公司 70 个 员工 最 近 
17 个 星期 搜索 模式 的 研究 结果 。 该 研究 先 于 后 面 讨论 的 试验 。 该 研究 中 检查 了 超过 20 000 
个 个 人 搜索 查询 和 16 000 个 搜索 选择 。 我 们 发 现 ， 平 均 下 来 ， 超 过 65% 的 查询 词组 同 其 
他 至 少 5 个 查询 词组 重合 了 至 少 5026 C0. 5 相似 度 阔 值 ) 的 查询 基本 词 ; 超过 90% 的 查询 
词组 同 其 他 25 个 查询 词组 共享 了 至 少 25% 的 查询 基本 词 。 换 句 话 说 ,该 临时 共同 搜索 群 
体 的 搜索 者 确实 用 相似 方式 搜索 了 相似 的 东西 ， 远 远 超出 典型 一 般 搜索 场景 中 出 现 的 大 约 
10% 的 重复 率 (0.5 FABER) C92]. 
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图 18.2 软件 公司 员工 所 用 的 搜索 查询 词 的 重复 度 和 相似 度 


更 多 在 其 他 搜索 者 群体 上 的 研究 证 实 了 该 重要 结果 [92]， 从 而 激发 了 我 们 协同 网 络 搜 
” 索 的 方法 。 该 结果 说 明 ， 在 相似 想法 的 搜索 者 群体 的 上 下 文中 ， 网 络 搜索 的 世界 是 一 个 重 
复 和 规律 的 地 方 。 在 个 人 进行 搜索 的 时 候 ， 他 们 的 搜索 经 验 生 成 了 一 种 群体 搜索 知识 。 反 
过 来 ， 该 搜索 知识 可 以 用 于 促进 群体 成 员 间 的 搜索 经 验 分 享 。 所 以 ， 作 为 一 个 简单 的 例 
子 ， 当 前 面 介绍 野生 门户 网 站 的 一 个 访客 搜索 “美洲 虎 图 片 ” 的 时 候 ， 可 以 向 其 推荐 使 用 过 
类 似 查 询 的 其 他 群体 成 员 所 选中 的 结果 。 这 些 结果 可 能 和 该 社团 的 野生 兴趣 相关 ， 从 而 不 
需要 任何 花费 很 大 代价 对 结果 内 容 进行 处 理 ， 我 们 就 可 以 通过 学 习 到 的 群体 偏好 来 个 性 化 
搜索 结果 。 通 过 这 种 方式 ， 新 搜索 者 可 以 分 享 到 更 有 经 验 的 搜索 者 的 知识 。 


1.0 Exact 


18.4.2 协同 网 络 搜索 系统 


图 18. 3 展示 了 我 们 的 协同 网 络 搜索 系统 的 基本 架构 ， 它 用 于 辅助 基础 主流 搜索 引 
擎 一 一 本 例 为 Google。 简 单 的 想法 是 ， 采 用 基于 代理 的 方法 来 拦截 通 往 底层 搜索 引擎 的 查 
询 ， 并 处 理 从 该 引擎 返回 给 用 户 的 结果 。 通 过 这 种 方式 ， 用 户 能 在 其 他 条 件 不 变 的 情况 
下 ， 得 到 他 们 感 兴趣 的 搜索 结果 。 但 是 在 以 协同 网 络 搜索 (CWS) 的 方式 中 ， 结 果 列 表 直 接 
通过 代理 得 到 提升 。 例 如 ， 用 户 U; 提交 给 Google 一 个 查询 9r， 该 请 求 重 定 向 给 CWS R 
统 ， 于 是 两 件 事 发 生 了 : 首先 ， 该 查询 传递 给 Google， 并 以 正常 方式 返回 一 个 结果 列表 
Rs 。 其 次 ， 该 查询 同时 也 用 于 访问 U: 的 群体 搜索 活动 的 一 个 本 地 存储 一 一 CWS fi p A 
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阵 ， 来 生成 一 个 排序 的 提升 候选 集 R, ， 如 下 所 述 。 解 释 引擎 通过 展示 群体 历史 的 图 形 化 
表示 来 对 该 提升 候选 项 进行 解释 。 结 果 列 表 R, ARs 合并 后 的 最 终 列表 Ri 被 返回 给 用 
户 。 通 常 这 种 合并 会 将 最 相关 的 & 个 (如 &=3) 改 进项 提升 到 结果 列表 的 前 列 。 


we ee eee eee ee ee ee a ee a a ee ee ee ees 





i 直接 返回 请 求 页 面 ! 
ITD 
URL 请 求 s 
01 + vow) 
E 
ws | 检索 Google 结 果 











图 18.3 CWS 系统 的 代理 结构 图 


因此 对 目标 搜索 查询 来 说 ，CWS 结合 了 由 标准 搜索 引擎 得 到 的 默认 结果 列表 Rs， 以 
及 由 群体 过 去 搜索 历史 得 到 的 推荐 (提升 ) 结 果 集 R,。 为 了 实现 这 一 点 ， 给 定 群 体 的 用 户 
搜索 历史 C(C— (U, e, U, AKT ar 中 ， 其 中 每 一 行 对 应 于 查询 % ， 每 一 列 
对 应 于 结果 页 p;，H5 的 值 表示 群体 C 的 成 员 通过 9, 选择 p; 的 次 数 。 用 这 种 方式 ， 每 个 
命中 矩阵 作为 一 个 群体 搜索 经 验 的 知识 库 和 群体 成 员 查 询 相关 的 结果 。 





Relevance(5;,q;) = DIRE (18. 1) 
T ys rm (18. 2) 
>} Relevance( 5;,q;) * Sim(gr,g;) 
WRel(5;,drsqi5**,q,) = SS 一 一 (18. 3) 


EN Exists(5;,q;) * Sim(qr,q;) 


当 响 应 一 个 新 目标 查询 qr AY, He 
用 于 识别 和 排序 过 去 常 选择 的 结果 。 查 
询 q; 和 结果 p, 的 相关 性 可 以 通过 以 往 q: 
对 应 的 p; 的 相对 频率 来 估算 ， 如 式 Web m Results 1 10 of about 74,300) 
(8. 1) 所 示 。 更 一 般 的 情形 是 ， 我 们 可 以 LISTE PPS Season sts: Gam-by-game stais Bio 
把 gr 相似 的 查询 的 结果 放 人 可 供 选择 的 “| eerie bnt Ph crit Lo m 
结果 池 ( 见 式 (18. 2)) ， 并 通过 相关 性 的 加 BA cam Menasi erdan Sarman sins greatest basketball player of al 
权 模 型 进行 排序 ， 如 式 18.3 SUR. To n nba eh ed s ri i CEDRL Bo 
ee eee meet ces EHE enn -we 


相关 性 。 注意 当 查 询 Qi 有 对 应 的 结果 页 dordan, Premies 


en wikipedia nighikv Micha el_Jordan - 130k - 5 azten- e 
Di 时 ， 谓语 Exist 返回 1， 反之 返回 0, 
18.4 和 图 18. 5 展示 了 谷歌 对 查 图 18.4 在 Google 中 搜索 Michael Jordan 的 结果 页 


Web Images Groups News mote » 


Goog le oo Asuanas 


Search: arh Dih Ihe web © pages from ireland 
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询 “Michael Jordan” 返 回 的 结果 列表 的 屏幕 快照 。 在 图 18. 4 的 例子 中 ， 我 们 可 以 看 到 默认 的 
谷歌 结果 列表 ， 篮 球 运动 员 明 显 占据 了 整个 结果 。 然 而 在 图 18.5 中 ,我们 可 以 看 到 ， 结 果 
列表 被 CWS 的 基于 代理 的 版 本 所 修改 ，( 本 例 ) 通 过 一 个 计算 机 科学 研究 者 群体 训练 。 结 果 
通过 标准 谷歌 接口 所 展示 ， 我 们 发 现 ， 最 前 面 3 个 结果 成 了 著名 的 伯克利 大 学 教授 5 。 另 外 ， 
提升 的 结果 通过 解释 图 标 进行 注解 ， 该 图 标 用 于 捕获 结果 群体 历史 的 不 同方 向 ， 包 括 捕获 
群体 成 员 结 果 流 行 性 ， 即 最 近 被 选择 的 频繁 度 的 信息 和 其 他 产生 该 选择 的 查询 的 信息 。 


| Popularity: 66. 66%. | 
Ths resuh has received! 66 66% of al chicks. for the curent query) | 


Web Images Groups News motes 
michael jordan ae er — ——— 
f2 Related queries: j 


! Query *s Selections | 
michael jordan machine leaming — 1000 — | 
; michael e! jordan, probability theory E | 
Jordan, Michael! dii aaa 
Graphical models, variational methods, machine learning, reasoning underjuncertainty 

vew CE berki ley edo jordan ' > * 


Search ^5 the web! 


Distinguished Lecturer Michael Jordan Fri, Apr 29, 2005 
Michael Jordan is Professor in the Department of Electrical Engineering and — on kernel 
macies: and on applications of stati ii cal machine leaming to 

imp volo c pdt ega/Di Xs sch ael andan Map sub brin 


DELF Michael! Jordan @B 2, 

Tommi Jaakkola, Michael | Jordan. Mean Field Theory for Sigmoid Belief Networks 
Michael |. Jordan: Reinforcement Learning by\Probability Matching 
http (Avene intürriatk anitir dertesédbndicek/s-tre2^^ enjan Mizhagl I7 hrent 

| Recency information: 
| Query Last Selection | 
| current query 21 45 hours ago | 


| michael jordan probability theory 2 1 weeks ago | 





图 18.5 由 计算 机 科学 研究 者 群体 所 训练 出 来 的 基于 CWS 系统 所 返回 的 Michael Jordan 搜索 结 
果 页 。 其 中 当 鼠 标 滑 过 后 会 展现 额外 的 信息 


18.4.3 评估 


目前 基于 代理 的 架构 用 来 作为 协同 搜索 场景 中 CWS 方法 的 长 期 试验 基础 。 本 节 将 描 
述 该 试验 的 最 新 结果 ， 它 将 证 明 CWS 提供 的 基于 群体 提升 的 价值 。 

该 试验 参与 者 包括 一 个 本 地 软件 公司 Dublin 的 70 多 位 员工 。CWS 架构 与 标准 
Google 搜索 引擎 配置 在 一 起 共同 运行 ， 以 便 所 有 的 Google 请 求 被 重 定向 给 CWS 系统 。 
搜索 体验 是 基于 标准 谷歌 接口 ， 对 任意 会 话 允 许 最 大 3 个 结果 提升 (以 及 解释 )。 如 果 超 过 
3 个 可 用 的 提升 ,那么 没有 提升 的 结果 使 用 解释 图 标 进行 标注 ， 但 仍 留 在 默认 的 谷歌 位 置 
中 。 此 处 展示 的 结果 来 自 超过 10 周 的 使 用 数据 和 覆盖 了 总 计 12 621 的 个 人 搜索 会 话 。 

评价 自然 环境 中 新 搜索 技术 的 一 个 挑战 是 ， 如 何 评价 个 人 搜索 会 话 的 质量 。 理 想 情况 
是 ， 我 们 捕获 用 户 搜索 时 直接 的 相关 反应 。 但 是 要 求 用 户 在 每 个 会 话 中 或 者 选择 特定 结果 
时 提供 这 样 的 反馈 ， 相 对 突 无 。 该 方法 在 当前 的 实验 中 是 不 可 行 的 ， 因 为 参与 者 想 要 确保 
他 们 的 搜索 经 验 不 会 偏离 常规 ， 因 此 不 愿意 接受 弹出 窗口 、 填 表 或 者 其 他 形式 的 额外 反 
馈 。 作 为 一 种 替代 ， 在 本 章 评 价 中 ， 我 们 使 用 较为 间接 的 相关 性 ， 它 基于 成 功 会 话 的 概念 
(参看 [92，91]) 。 我 们 定义 一 个 成 功 的 会 话 为 ， 至 少 一 个 搜索 结果 被 选择 ， 表 明 用户 发 现 


© Michael Jordan 是 机 器 学 习 方向 的 泰斗 之 一 。 一 一 译 者 注 
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至 少 一 个 (部 分 ) 相 关 结 果 。 反 之 ,一 个 用 户 没 有 选择 任何 结果 的 搜索 会 话 则 被 认为 是 失败 
的 ， 意 味 着 用 户 没 有 发 现任 何 相关 结果 。 虽 然 这 是 对 整体 搜索 质量 的 一 种 相对 粗糙 的 衡 
E, 但 它 至 少 允 许 我 们 系统 地 比较 搜索 会 话 。 

关于 带 提升 的 会 话 (promoted session) 和 不 带 提升 的 标准 会 话 (standard session) 的 成 
功率 比较 展示 在 图 18.6 中 。 该 结果 显 
示 ， 在 10 周 的 实验 过 程 中 ， 带 提升 的 会 
话 平均 要 比 只 包含 谷歌 结果 的 标准 会 话 
更 有 可 能 成 功 。 这 几乎 30% 的 收益 是 由 
于 基于 群体 的 提升 。 换 名 话说， 在 实验 
过 程 中 ， 我 们 发 现 ， 超 过 一 半 的 使 用 标 
准 Google 搜索 会 话 的 用 户 找 不 到 任何 值 
得 选择 的 结果 。 相 反 ， 在 同一 时 期 ， 同 
样 的 搜索 者 在 包含 了 群体 提升 的 会 话 中 ， 会 话 类 型 
有 着 明显 更 大 的 成 功率 ， 只 有 不 到 40% 
的 会 话 不 能 成 功 地 吸引 用 户 做 出 选择 。 
在 企业 中 ， 当 涉及 整体 搜索 生产 力 时 ， 这 些 结 果 会 有 重要 的 影响 。 因 为 在 许多 知识 密集 的 
商业 场景 中 ， 可 以 通过 剔除 的 失败 搜索 会 话 得 到 很 大 的 提升 。 例 如 ， 在 国际 数据 团体 
(IDC) 的 一 个 最 新 报告 [30] 中 发 现 ， 知 识 工 作者 平均 花费 25% 的 时 间 用 于 搜索 信息 ， 从 而 
一 个 有 着 1000 个 知识 工作 者 的 企业 每 年 将 会 因为 不 能 定位 和 检索 信息 ， 浪 费 掉 250 万 美 
元 (有 时 达到 1500 万 美元 ) 。 在 该 情形 下 ， 任 何 显著 减少 失败 搜索 会 话 的 方法 都 对 提升 企 
业 生 产 力 有 着 巨大 的 作用 ， 对 更 大 型 的 组 织 尤 其 如 此 。 











图 18.6 提升 前 后 的 会 话 成 功率 对 比 


18.4.4 . 讨论 


这 里 的 协同 网 络 搜索 模型 力求 利用 自然 出 现 的 搜索 重复 性 和 群体 相似 想法 的 搜索 者 间 
结果 选择 的 规律 性 。 在 本 例 研究 中 ， 我 们 关注 一 个 特别 的 搜索 群体 ， 员 工 群 。 明 显 地 ， 这 
是 一 个 相当 简单 明确 的 群体 ， 不 奇怪 我 们 能 在 协同 网 络 搜索 中 发 现 其 高 度 重复 性 和 规律 
VE, 尽管 如 此 ， 由 执行 相似 信息 查找 任务 的 个 人 所 聚集 起 来 的 群体 非常 普遍 ， 不 管 是 同一 
公司 的 员工 ， 或 是 同一 班级 的 学 生 ， 或 是 同一 研究 组 的 研究 员 ， 都 属于 该 群体 类 。 

当然 还 有 很 多 其 他 群体 类 。 例 如 ， 我 们 已 经 提 到 的 场景 ， 对 同一 主题 网 站 的 访客 组 成 
的 群 组 可 以 视 为 一 个 特别 搜索 群体 。 更 普遍 地 ， 有 趣 的 是 人 们 将 群体 挖掘 和 识别 看 作 开放 
式 的 问题 ， 目 前 也 有 很 多 研究 致力 于 采用 各 种 方法 自动 识别 在 线 群体 ， 具 体 可 以 参看 [11， 
5，21，106，105]。 为 了 更 好 地 理解 新 社会 网 络 世界 中 的 在 线 群体 的 本 质 ， 最 好 提供 一 种 
更 灵活 的 搜索 协作 形式 ， 并 通过 更 灵活 和 动态 地 定义 搜索 群体 定义 得 以 促进 。 


18.5 案例 研究 2: 网 络 搜索 共享 


之 前 的 案例 站 在 协同 网 络 搜索 的 群体 视角 ， 有 相似 想法 的 用 户 群 体 的 搜索 活动 用 于 影 
响 主流 搜索 引擎 结果 。 本 节 描 述 另 一 种 协同 网 络 搜索 模型 。 该 模型 在 HeyStaks 系统 中 实 
现 ， 在 方式 上 有 两 点 重要 的 不 同 : 首先 ，HeyStaks 对 协同 网 络 搜索 采用 了 更 多 的 用 户 导 
向 方法 ， 帮 助 用 户 更 好 地 组 织 和 分 享 他 们 的 搜索 体验 。 为 了 做 到 这 一 点 ，HeyStaks 允许 
用 户 创建 和 分 享 搜索 体验 的 知识 库 ， 而 不 是 协调 在 搜索 群体 中 的 参与 度 。 其 次 ， 我 们 对 搜 
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索引 擎 整合 采用 了 非常 不 一 样 的 方式 。 我 们 没有 采用 上 一 研究 案例 中 描述 的 基于 代理 的 方 
法 ， 而 是 把 一 个 浏览 器 工具 栏 整合 进 主流 搜索 引擎 ， 如 Google 中 。 该 浏览 器 工具 栏 能 让 
协同 搜索 引擎 具有 捕获 和 引导 搜索 活动 的 能 力 。 最 后 ， 我 们 将 总 结 最 近 关 于 真实 用 户 研 究 
的 发 现 ， 来 探索 HeyStaks 用 户 群 中 出 现 的 搜索 协同 本 质 。 


18.5.1 HeyStaks 系统 


HeyStaks 在 主流 搜索 引擎 中 加 入 了 两 个 基本 特征 。 第 一 ， 它 允许 用 户 创建 搜索 堆 
(search stak) 一 种 在 搜索 时 记录 搜索 体验 的 文件 夹 。 用 户 可 以 把 搜索 堆 与 其 他 用 户 分 
享 ， 让 他 们 把 他 们 的 搜索 也 添加 进来 。 第 二 ，HeyStaks 使 用 用 户 的 搜索 堆 来 生成 推荐 ， 
并 将 其 加 入 主流 搜索 引擎 的 结果 中 。 这 些 推荐 是 之 前 的 搜索 堆 的 成 员 认 为 对 类 似 查 询 相 关 
的 结果 ， 帮 助 搜索 者 发 据 他 的 好 友 或 同事 觉得 有 意思 的 结果 ， 否 则 这 些 结果 很 可 能 永远 埋 
在 Google 的 默认 结果 列表 中 。 

如 图 18.7 所 示 ，HeyStaks 采用 两 种 形式 的 基本 组 件 : 一 个 客户 端的 浏览 器 工具 栏 和 
一 个 后 端 服务 器 。 工 具 栏 允许 用 户 创建 和 分 享 搜索 堆 ， 并 提供 一 些 如 打 标 签 和 给 网 页 投票 
等 辅助 功能 。 工 具 栏 也 捕获 搜索 点 击 和 管理 HeyStaks 推荐 和 默认 结果 列表 的 整合 。 后 端 
服务 器 管理 个 人 堆 索 引 ( 个 人 网 页 与 查询 /标签 关键 词 和 正面 /负面 投票 的 索引 )、 堆 数据 库 
( 堆 标 题 、 成 员 、 描 述 、 状 态 等 )、HeyStaks 社会 网 路 服务 以 及 推荐 引擎 。 在 余下 内 容 中 ， 
我 们 将 简单 概述 HeyStaks 的 基本 操作 ， 然 后 关注 推荐 引擎 背后 的 细节 。 


HeyStaks 








推荐 候选 


推荐 引擎 





图 18.7 HeyStack 系统 架构 图 以 及 离线 推荐 模型 


考虑 一 个 生动 的 例子 。Steve、Bill 和 一 些 朋 友 计 划一 次 欧洲 旅行 ， 他 们 将 使 用 网 络 搜 
索 作 为 主要 的 信息 获取 源 ， 来 了 解 该 做 什么 和 该 访问 哪些 景点 。Steve 创建 了 一 个 叫 作 “ 欧 
洲 旅行 2008” 的 (私有 ) 搜 索 堆 ， 并 把 它 分享 给 了 Bill 和 其 他 朋友 ， 鼓 励 他 们 在 旅游 相关 的 
搜索 中 使 用 该 搜索 堆 。 

图 18. 8 H, Steve 在 开始 新 的 关于 “都 柏林 旅馆 ”的 搜索 时 选择 了 该 搜索 堆 ， 结 果 展 示 
在 图 18. 9 中 。 在 Google 的 结果 中 ，HeyStaks 额外 增加 了 两 个 推荐 ， 因 为 最 近 “ 欧 洲 旅行 
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2008” 搜 索 堆 的 其 他 成 员 通过 选择 、 投 票 、 标 签 的 方式 ， 发 现 这 些 结果 相关 。 这 些 结果 可 
能 存在 于 Google 结果 中 很 深 的 位 置 或 者 甚至 不 在 该 查询 的 结果 集中 。 其 他 相关 结果 也 将 
被 HeyStak 强调 ， 但 是 仍 留 在 Google 结果 中 的 原 位 。 通 过 该 方式 ，Steve 和 Bill 从 他 们 以 
往 的 相似 搜索 中 彼此 受益 。 此 外 ，HeyStaks 可 以 根据 其 他 相关 的 公共 搜索 堆 进 行 推荐 ， 
帮助 用 户 从 其 他 群 组 或 群体 创建 的 搜索 知识 中 获 益 。 


1 ws Searches - by StellaB 


Academic Research - by Barry 
Active Learning - by mohans 
hci - by hlee 

mm 


创建 、 共 享 和 移 除 搜索 堆 
| stability clustering ] Advanced Search 


Search: & tne web C pages from Ireland 


Google.ie offered in: Gaeilge 





图 18.8 选择 一 个 新 的 搜索 堆 


Google mwas — - 
Search: @ the web O pages from Ireland 


Web Results 1 - - 40 of about 1,780,000 for stability clustering. (0.06 seconds) 





m from your Staks: 
| machine leaming, My Searches 


FH stability Based Model Selection vaso (4 HeyStaks 推 广 
File Format: PDF/Adobe Acrobat - View as HTML File Format: JAdobe Acrobat - View as 


votre Foret: PDF/Adobe Acrobat - View as HTML File Format: PDF/Adobe Acrobat - 
View as HTM! 

tela nie cobape Me pat" 7 pdi - ?k - Simiar pages 

Related Stake: machine leaming My Searches 


el based (2) 
File Format: PDF/Adobe Acrobat - View as HTML File Format: PDF/Adobe Acrobat - View as 
HTML File Format: POF/Adobe Acrobat - View as HTML File Format: POF/Adobe Acrobat - 
View as HTML 
www,ambient-networks org/phase!web/...ed Multi Hop clustering Protocol pdf - 7k - 


Cached 

Related Staks: machine leaming My Searches 

Ell Theoretical analysis of a directional stability-based clustering ... E E] 0 F3 E 
based (2) 

portal.acm.org/citation.cfm?id« 1410059 - ?k - Cached - Similar pages 


portal.acm.org/citation.cfm?id» 1410059 - ?k - Cached - Similar pages 
porin ag de 1410058 - ?k - Cached - Similar pages 
Staks: My Searches machine leaming 


Pon A Sober Look at Clustering Stability 
- View as HTML 


Fite Format ian ADM 


Www.c8.uwatertoo.ca/-sha/sober. pdf - 





18.9 基于 HeyStack 的 Google 搜索 结果 


独立 于 工具 栏 ，Heystaks 的 用 户 也 可 以 从 HeyStaks 搜索 门户 中 获 益 ， 该 门户 提供 一 
个 用 户 搜索 历史 的 社会 网 络 。 例 如 ， 图 18. 10 显示 了 “欧洲 旅行 2008” 搜 索 堆 的 门户 主页 ， 
它 对 所 有 的 堆 成 员 开 放 。 它 展示 一 种 最 近 搜索 历史 和 查询 云 活动 的 反馈 ， 以 便 用 户 找 出 其 
他 人 搜索 过 的 东西 。 该 搜索 门户 也 提供 给 用 户 更 广 的 功能 ， 例 如 ， 搜 索 堆 维护 (在 搜索 堆 
之 内 和 之 间 进 行 编 辑 、 移 动 、 复 制 操作 ) ， 丰 富 的 搜索 和 过 滤 工 具 ， 以 及 管理 他 们 自己 搜 
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索 文档 和 新 搜索 伙伴 的 大 量 特 征 。 


European Vacation 2008 by StevaJ (Private) 3 stak members, 20 pages 
Description Things to do and places to seo on this year's vacabon. 


Tee 搜索 堆 活跃 订阅 


Searching activity within this stak 
Tocey B Cartire.ie | Car Rental eland， Car Hire, ‘Car was setectad for the query car hire na 


ireland in European Vacation 2008 (prvate) sec ago. 
四 Discover (roland - irish Golf - goling holidays and tourism ... was lagged with golf partal m European 
Vacation 2008 (prwate) 30 sec ago. 
E Golfing ireland was selected for the query golfing ireland in European Vacation 2008 
(prreate) 51 nec ago. 
Bl. Luxury Hotels in Dubin was selected fcr the query dublin hotels in European Vacation 2008 
(prata) 59 sec ago. 


Bl Luxury Hotels and Luxury Resorts: The Ritz-Carlton Hotels &amp; Resorts was setected ‘or 
the query ritz carlton n European Vacation 2008 (private) 11 men 33 sec ago 


Stak Members 


Barry- View Barry's 
Member of 32 staks. Created 22 staks 
Co-nembers of 2 staks (Academic Research. European Vacation 2008) 


? SteveJ- View Steve's profite 
Mambor of 6 stake, CrealedS Saks 





四 rsteiner - 1 stak, 0 buddy 
图 18.10 HeyStack 搜索 门户 提供 了 搜索 堆 和 历史 搜索 记录 的 直接 访问 人 口 


18.5.2 HeyStaks 推荐 引擎 


在 HeyStaks 中 ， 每 一 个 搜索 任务 (S) 作 为 一 个 该 搜索 堆 成 员 搜索 活动 的 文档 。Hey- 
Staks 结合 a EU 每 个 任务 由 一 个 结果 集 
(S 二 {pi1，…，pi)) 组 成 ， 并 且 每 个 页 面 匿名 地 和 大 量 隐 式 和 显 式 的 指示 器 关联 ， 包 括 结 
miis Geb IV ol 产生 该 结果 的 查询 关键 词 (g! ，…，g,)、 结 果 被 打上 标签 的 次 数 
和 标签 关键 词 (1 ，…，z,,)、 接 受 的 投票 (v+ ，v )， 以 及 分 享 过 的 人 数 (share)( 显 式 的 兴 
趣 反 馈 )， 如 式 (18. 4). ` 

ji EEE PEIE EI d v O deg share) (18. 4) 

该 方式 ， 每 个 页 面 与 一 个 词 条 数据 (查询 词 条 或 标签 词 条 ) 和 一 个 使 用 行为 数据 

(选择 、 标 签 、 分 享 、 投 票 统计 ) 的 集合 关联 起 来 。 词 条 数据 以 Lucene(lucene. apache. org) 
索引 表 表 示 ， 其 中 每 个 页 面 与 相关 联 的 查询 和 标签 关键 词 索引 起 来 ， 提 供 检 索 和 排序 提升 
候选 的 基础 。 使 用 行为 数据 提供 额外 的 置信 源 ， 用 于 过 滤 结果 并 生成 最 终 推荐 列表 。 搜 索 
时 ， 推 荐 结果 通过 许多 阶段 生成 : 相关 结果 从 Lucene 堆 索 引 中 检索 并 排序 ; 这些 推 荐 候 
选 通 过 置信 模型 噜 除 噪声 推荐 ; 剩余 的 结果 通过 一 系列 推荐 规则 添加 到 Google 结果 列表 中 。 

简单 地 说 ， 有 两 种 有 价值 候选 集 : 首要 价值 是 那些 从 活跃 搜索 堆 S 中 产生 的 ; 次 要 价 
值 是 从 搜索 者 搜索 堆 列 表 中 产生 的 。 为 了 生成 这 些 有 价值 的 候选 ，HeyStaks 服务 器 使 用 当前 
查询 g, 作为 每 个 搜索 堆 索引 S 的 探 针 ， 来 识别 相关 搜索 堆 页 的 PS, g RA. EMREN 
Wi p 使 用 Lucene 的 TF. IDF 检索 函数 式 (18. 5) 进 行 打分 ， 作 为 初始 化 推荐 排序 的 基础 。 
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score(q,,p) = >)tf(t € p) + idfCo? (18. 5) 


1€ q, 


搜索 堆 不 可 避免 地 会 有 噪声， 因为 他 们 常常 会 包含 那些 主题 外 的 页 面 。 例 如 ， 搜 索 者 
常常 忘记 在 搜索 会 话 开 始 时 设置 一 个 合适 的 搜索 堆 ， 虽 然 HeyStaks 包含 了 许多 自动 的 搜 
索 堆 选择 技术 来 确保 正确 的 搜索 堆 被 激活 ， 但 这 些 技术 仍 不 完美 ， 误 分 类 不 可 避免 地 会 发 
4; 参看 文献 [18，95]。 从 而 ， 检 索 和 排序 的 阶段 可 能 选择 了 和 当前 查询 内 容 不 严格 相关 
的 页 面 。 为 了 避免 产生 假 推 荐 ，HeyStaks 采用 了 置信 过 滤 ， 使 用 一 系列 阔 值 模型 ， 根 据 
特定 结果 的 使 用 记录 ， 来 估算 其 相关 性 ; 标签 使 用 记录 被 认为 比 投票 更 重要 ， 而 后 者 又 比 
隐 式 使 用 记录 更 重要 。 例 如 ， 只 被 一 个 搜索 堆 用 户 选择 过 一 次 的 页 面 ， 自 动 地 不 被 考虑 进 
来 ， 其 他 类 似 的 情况 也 同样 进行 剔除 。 该 模型 的 详细 细节 超出 了 本 书 的 范围 ， 但 进一步 考 
虑 ， 能 够 肯定 的 是 ， 任 何不 满足 必要 使 用 记录 阔 值 的 结果 都 将 被 剔除 。 

在 使 用 记录 修剪 后 我 们 得 到 了 改进 的 首要 和 次 要 推荐 ， 最 后 的 任务 就 是 将 这 些 合格 推 
荐 加 入 Google 推荐 列表 中 。HeyStaks 使 用 若干 不 同 的 推荐 规则 来 决定 怎样 和 在 哪 添加 这 
些 推荐 。 同 样 地 ， 篇 幅 的 限制 使 得 我 们 无 法 对 该 组 件 进行 详细 的 解释 ， 但 是 ， 像 前 3 个 主 
提升 项 总 是 被 加 入 到 Google 结果 列表 的 前 面 ， 并 使 用 HeyStaks 的 推荐 图 标 进行 标记 。 如 
果 一 个 余 留 的 首要 推荐 仍然 在 默认 的 Google 结果 列表 中 ， 那 么 它 将 被 标记 在 合适 的 位 置 。 
如 果 仍 有 余 留 首要 推荐 ， 那么 它们 将 会 加 入 次 要 推荐 列表 中 。 次 要 推荐 列表 通过 TF. IDF 
分 数 进行 排序 ， 然 后 作为 一 个 可 选 的 可 扩展 的 推荐 列表 加 入 Google 的 结果 列表 中 ; 更 多 
详情 请 参看 文献 L93 94]. 


18.5.3 评估 


本 节 测试 了 早期 使 用 了 工具 栏 和 服务 beta 版 本 以 来 仍 活路 的 部 分 95 位 HeyStaks 用 
户 。 他 们 在 2008 年 10—12 月 间 进 行 注册 ， 下 面 的 结果 是 他 们 2008 年 8 月 到 2009 年 1 月 
的 使 用 总 结 。 我 们 的 目的 是 更 深 地 理解 用 户 如 何 使 用 HeyStaks 以 及 是 否 从 搜索 推荐 中 获 
益 。 因 为 这 是 一 个 在 非 实验 环境 下 对 真实 用 户 的 研究 ， 所 以 对 测量 有 一 些 必然 的 限制 。 比 
如 ， 没 有 实验 对 照 组 ， 而 且 主要 出 于 数据 隐私 的 原因 ， 通 过 对 比 Google 默认 结果 和 Hey- 
Staks 推荐 结果 来 分 析 用 户 的 相关 点 击 行为 也 是 不 可 行 的 。 但 是 对 于 感 兴趣 的 读者 来 说 ， 
我 们 之 前 的 工作 记录 了 对 该 分 析 的 更 常规 的 对 照 组 实验 研究 [10，25，92] 。 

HeyStaks 主张 的 关键 是 搜索 者 需要 用 更 好 的 方式 来 组 织 和 共享 他 们 的 搜索 体验 。 
HeyStaks 提供 这 些 特征 ， 但 这 些 用 户 是 否 真 的 肯 花 时 间 来 创建 搜索 堆 ? 他 们 是 否 愿意 与 
他 人 共享 或 者 加 入 其 他 用 户 的 搜索 堆 ? 

在 HeyStaks 初始 部 署 的 过 程 中 ， 用 户 确 实 创造 了 可 观 的 搜索 堆 并 进行 了 分 享 。 例 如 ， 
根据 图 18. 11， 测 试 版 用 户 平均 创建 超过 3. 2 个 新 搜索 堆 并 参加 超过 1. 4 个 。 也 许 这 不 奇 
BE. 大 部 分 用 户 创建 和 分 享 少量 搜索 堆 给 小 圈子 内 的 同事 和 朋友 ， 至 少 在 刚 开始 的 时 候 。 

总 计 有 超过 300 个 搜索 堆 创建 在 大 范围 的 主题 上 ， 从 宽泛 的 主题 如 旅游 、 研 究 、 音 乐 
和 电影 ， 到 小 兴趣 包括 建筑 、 黑 白 照片 和 山地 车 。 有 少数 用 户 是 大 量 搜索 堆 的 创建 者 和 参 
与 者 : 一 个 用 户 创建 了 13 个 搜索 堆 并 加 入 了 另外 11 个 搜索 堆 ， 同 其 他 47 个 研究 者 (共享 
相同 的 搜索 堆 的 用 户 ) 建 立 了 研究 网 。 事 实 上 平均 下 来 ， 每 个 用 户 通过 共享 的 搜索 堆 仅 经 
过 5 个 其 他 研究 者 就 能 连接 到 研究 网 。 

多 数 的 搜索 堆 是 公共 的 ， 虽 然 大 部 分 (52%) 只 含 一 个 成 员 ， 即 创建 者 。 因 此 ，48% 的 
搜索 堆 分 享 给 了 其 他 至 少 1 个 用 户 ,事实 上 这 个 数字 平均 下 来 是 3.6。 另 一 种 看 法 如 
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图 18. 11b 所 示 : 70%% 的 用 户 分 享 和 参加 了 搜索 堆 ， 只 有 30% 的 用 户 只 为 自己 创建 搜索 堆 
并 拒绝 加 入 其 他 用 户 的 搜索 堆 。 





, gib o mmy 
a) 创建 和 加 入 的 搜索 堆 数 b) 社交 用 户 与 孤立 用 户 


图 18. 11 每 个 用 户 的 平均 搜索 堆 创建 数 和 加 入 数 以 及 社交 用 户 和 和 孤立 用 户 的 比率 


HeyStak 的 核心 思想 是 受 这 样 的 观点 启发 : 网 络 搜索 是 天 然 的 社会 化 或 协同 活动 。 尽 
管 主 流 搜索 引擎 没 有 进行 支持 ， 研 究 者 也 确 有 寻找 替代 的 协同 频道 (如 email, IM 等 ) 来 分 
享 他 们 的 搜索 体验 ， 尽 管 这 并 不 高 效 ， 参 看 示例 L57]。HeyStak 早期 一 个 最 重要 的 问题 
是 ， 在 何 种 程度 上 他 们 的 自然 搜索 活动 能 有 助 于 创建 协同 搜索 者 群体 。 像 用 户 搜索 、 标 签 
和 投票 一 样 ， 他 们 有 效 地 生产 和 消费 群体 搜索 知识 。 一 个 用 户 可 能 是 第 一 个 选择 或 打 标签 
某 个 结果 作为 一 个 搜索 堆 ， 在 这 种 情况 下 ， 他 们 生产 了 新 的 搜索 知识 。 接 着 ， 如 果 该 结果 
被 推荐 给 另 一 个 用 户 并 重 选 择 ( 打 标签 或 投票 ) ， 那 么 该 用 户 消费 了 该 搜索 知识 。 当 然 ， 他 
们 也 生产 了 搜索 知识 ， 因 为 他 们 的 选择 、 标 签 或 投票 将 加 入 搜索 堆 中 。 

我 们 发 现 85% 的 用 户 参 与 到 了 搜索 协同 中 。 其 中 大 多 数 消 费 了 至 少 一 个 其 他 用 户 生 产 
的 结果 ， 平 均 下 来 ， 这 些 用 户 消费 了 7.45 个 其 他 用 户 的 结果 。 作 为 对 比 ，50% 的 用 户 生 
产 了 至 少 被 一 个 其 他 用 户 消费 的 知识 ， 本 例 中 的 生产 者 创建 的 知识 平均 被 超过 12 个 其 他 
用 户 消 费 。 

我 们 应 该 问 一 个 问题 ， 在 何 种 程度 上 ,个 人 用 户 倾向 于 成 为 搜索 知识 的 生产 者 或 消费 
者 ?是 否 一 些 搜索 者 是 搜索 知识 的 网 络 生 产 者 ， 即 他 们 更 倾向 于 创建 对 他 人 有 用 的 搜索 知 
W? 是 否 另 一 些 用 户 是 网 络 消费 者 ， 即 他 们 更 倾向 于 消费 他 人 创建 的 搜索 知识 ? 该 数据 如 
图 18. 12a 所 示 。 为 了 弄 清楚 这 一 点 ， 网 络 生产 者 定义 为 : 帮助 过 的 人 比 帮助 自己 人 更 多 
的 用 户 ; 而 网 络 消 费 者 定义 为 帮助 自己 的 人 比 帮助 过 的 人 更 多 的 用 户 。 图 18. 12 显示 47% 
的 用 户 是 网 络 生产 者 。 值 得 注意 的 是 ， 我 们 在 上 面 提 到 有 50% 的 用 户 生成 了 被 其 他 用 户 消 
费 过 的 搜索 知识 。 这 也 意味 着 绝 大 部 分 的 用 户 ， 事 实 上 是 94%% 的 用 户 ， 帮 助 的 人 比 帮助 自 


己 的 人 更 多 。 


Beo  "- 网 络 消费 者 a 对 等 优化 m BAG 
a) 生产 者 与 消费 者 b) 对 等 优化 与 自 优化 


18.12 ”网络 生产 者 和 消费 者 的 比率 以 及 对 等 优化 和 自 优化 的 比率 
所 以 ， 我 们 发 现 大 量 用 户 帮 助 别人 ， 同 时 大 量 用 户 被 人 帮助 。 也 许 ， 这 种 利他 主义 只 
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限于 小 数量 的 搜索 ? 也 许 ， 用 户 在 个 人 搜索 的 大 多 时 候 靠 的 还 是 自己 ? 换个 视角 看 上 述 分 
析 可 以 帮助 解释 该 问题 ， 即 观察 用 户 在 搜索 时 判断 足够 相关 而 选择 的 优化 项 的 根源 。 总 的 
来 说 ， 测 试 版 的 用 户 在 搜索 时 选择 了 超过 11 000 个 优化 项 。 一 些 优化 项 是 从 搜索 者 自己 的 
历史 记录 来 的 ， 我 们 称 为 自 优 化 ; 其 他 的 则 是 从 分 享 了 搜索 堆 的 用 户 来 的 ， 我 们 称 为 对 等 
优化 。 直 观 上 讲 ， 自 优化 的 选择 对 应 于 HeyStaks 中 帮助 用 户 回 顾 他 们 之 前 找到 的 结果 的 
例子 ， 而 对 等 优化 则 对 应 于 发 所 任务 ， 帮 助 用 户 关注 可 能 错过 或 者 很 难 找到 的 新 内 容 ， 具 
体 参看 [61，50]。 因 此 图 18. 12b 比较 对 等 优化 和 自 优化 ， 发 现 66% 的 优化 选择 来 自 于 搜 
索 者 自己 的 历史 搜索 记录 ， 大 多 时 候 HeyStaks 帮助 用 户 重新 获得 以 前 发 现 的 结果 。 然 而 ， 
对 等 优化 被 选择 的 比例 为 34%% (我 们 已 经 知道 它们 来 自 很 多 不 同 的 用 户 )， 可 以 帮助 搜索 者 
挖掘 他 人 发 现 的 新 信息 。 

对 自 优 化 的 偏差 并 不 奇怪 ， 特 别 是 考虑 搜索 者 的 习惯 和 搜索 堆 开发 的 早期 阶段 。 大 多 
数 搜索 堆 早 期 的 增长 都 是 通过 单个 用 户 ， 通 常 是 创建 者 ， 然 后 大 部 分 的 页 面 优 先 就 生成 
了 一 一 作为 创建 者 自己 的 搜索 查询 的 回应 。 大 部 分 的 优化 是 自 优化 的 某 些 页 面 ， 即 来 自 领 
导 者 自己 的 搜索 活动 。 很 多 搜索 堆 并 没有 分 享 ， 因 此 只 能 用 于 生成 自 优化 。 随 着 搜索 堆 的 
分 享 和 更 多 用 户 的 加 入 ， 搜 索 者 堆 变 得 更 多 样 。 更 多 的 结果 被 对 等 用 户 的 动作 所 加 入 ， 更 
多 的 对 等 优先 被 生成 和 选择 。 在 之 后 的 工作 中 ， 一 个 有 意思 的 任务 是 ， 探 索 搜索 堆 的 演 
化 ， 来 研究 越 来 越 多 的 用 户 是 如 何 影响 搜索 堆 内容 和 优化 的 。 目 前 比较 满意 的 是 ， 即 使 在 
搜索 堆 演化 的 早期 ， 每 个 搜索 堆 平均 也 能 有 3 一 4 个 成 员 ， 在 34% 的 时 间 里 ， 成 员 受 益 于 
对 等 用 户 动作 所 产生 的 优化 。 l 


18.5.4 讨论 


同 第 一 个 案例 研究 比较 ，HeyStak 促进 了 一 种 更 直接 形式 的 搜索 协同 
地 被 用 户 创建 和 分 享 一 一 最 后 微 搜索 群体 形成 了 ， 研 究 者 小 组 可 以 基于 某 个 主题 或 题目 进 
行 协作 。 当 然 不 排除 大 协同 小 组 的 形成 ， 而 且 很 有 可 能 某 种 搜索 堆 演化 成 搜索 群体 的 方 
式 ， 与 之 前 案例 研究 所 预期 的 非常 吻合 。 

本 案例 研究 遗留 了 许多 未 解 问题 ， 因 此 未 来 仍 有 很 大 的 研究 空间 。 例 如 ， 洪 在 的 搜索 
堆 增长 将 产生 全 新 的 推荐 机 会 ， 因 为 用 户 将 会 从 加 入 什么 搜索 堆 的 推荐 中 受益 。 此 外 ， 考 
虑 合并 或 分 解 搜索 堆 也 将 会 是 有 意思 的 事情 ， 例 如 ， 用 户 可 以 结合 已 有 的 搜索 堆 创建 新 的 
搜索 堆 。 


18.6 总 结 





网 络 搜索 引擎 是 并 且 毫 无 疑问 将 继续 是 我 们 用 于 探索 在 线 信息 的 主流 工具 。 对 所 有 如 
Google 的 主流 搜索 引擎 的 成 功 来 说 ， 网 络 搜索 问题 仍然 远 远 没有 解决 ， 对 新 一 代 网 络 搜 
索 技术 的 研究 也 在 完善 中 。 在 未 来 很 有 可 能 主流 搜索 引擎 将 会 演化 到 为 用 户 提供 更 多 的 支 
持 ， 使 用 户 在 对 的 时 间 找 到 对 的 信息 ， 而 推荐 技术 注定 会 扮演 重要 的 角色 。 

例如 ， 研 究 者 已 经 知道 如 何 通过 结合 用 户 个 人 资料 和 推荐 技术 ， 让 搜索 引擎 对 我 们 特 
别 的 、 个 人 的 需求 和 偏好 做 出 更 多 的 响应 ， 以 呈现 更 个 性 化 的 用 户 体验 ， 不 管 是 通过 目标 
结果 列表 的 生成 还 是 改进 的 查询 推荐 。 另 一 个 研究 则 试图 通过 提供 给 搜索 者 培养 和 改进 小 
群 组 甚至 大 的 搜索 者 群体 的 新 工具 ， 来 寻求 利用 很 多 网 站 搜索 任务 的 内 在 的 协同 本 质 。 

本 章 通过 考察 若干 代表 性 的 系统 和 技术 ， 提 供 了 自主 研究 中 一 些 有 趣 领 域 的 简单 介 
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绍 。 接 着 强调 了 这 些 互 补 的 协同 个 性 化 网 络 搜 索 方法 是 如 何 结合 起 来 作为 协同 辅助 ， 来 为 
用 户 提供 更 好 的 个 性 化 的 ， 推 荐 系统 在 其 中 扮演 了 一 种 新 的 社交 搜索 服务 中 心 角色 。 就 这 
方面 我 们 提出 了 两 种 不 同 的 社交 搜索 系统 案例 研究 ， 来 展现 在 实际 中 如 Google 的 主流 搜 
索引 擎 是 如 何 通过 这 些 方法 进行 改进 的 。 

在 未 来 ， 随 着 推荐 系统 在 网 络 搜索 中 扮演 着 日 益 重 要 的 角色 ， 主 流 搜索 引擎 很 有 可 能 
采纳 这 些 方法 中 的 原理 而 进化 。 今 天 网 络 搜索 很 大 地 依赖 于 个 人 搜索 者 ， 我 们 相信 推荐 技 
术 的 引入 将 会 使 搜索 引擎 变 得 更 有 前 脆性 ， 因 为 他 们 将 会 参与 而 不 是 响应 用 户 的 信息 需 
求 。 同 时 ， 这 会 提供 很 多 研究 机 会 ， 特 别 是 在 搜索 接口 的 层面 ， 因 为 我 们 要 寻找 能 使 推荐 
技术 和 网 络 特性 相 结合 的 新 方法 。 的 确 ， 我 们 已 经 看 到 一 些 早 期 的 例子 如 谷歌 、 雅 虎将 查 
询 推荐 技术 结合 到 常规 搜索 框 中 。 但 是 ， 这 只 是 一 个 开始 ， 当 研究 者 面临 性 能 、 隐 私 等 挑 
战 时 ， 搜 索引 擎 将 为 下 一 代 推 荐 技术 提供 一 个 独立 的 平台 。 正 如 早期 作为 推荐 系统 平台 的 
电子 商务 网 站 一 样 ， 搜 索引 擎 将 会 为 推荐 系统 时 代 赢 得 更 多 追随 者 。 
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社会 化 标签 推荐 系统 





Leandro Balby Marinho, Alexandros Nanopoulos, Lars Schmidt- Thieme, 
Robert Jáschke, Andreas Hotho, Gerd Stumme 和 PanagiotisSymeonidis 


WE ”社会 化 标签 系统 作为 新 一 代 的 网 络 应 用 已 经 成 功 建立 了 ， 并 且 在 不 断 地 发 展 。 
社会 化 标签 系统 本 身 具 有 开放 性 和 社会 性 ， 这 些 特点 已 经 证 实 能 够 有 效 地 促进 用 户 参 与 。 
然而 在 社会 化 标签 系统 带 来 更 多 机 遇 的 同时 ， 也 使 得 一 些 旧 的 问题 重新 出 现 ， 如 信息 过 
载 。 推 荐 系统 也 是 一 种 更 好 地 提高 相关 内 容 级 别 同 时 过 滤 网 上 不 断 产 生 的 “噪声 ”， 方 便 获 
取 有 效 信息 的 方式 。 但 是 在 社会 化 标签 系统 中 ， 我 们 面临 着 新 的 挑战 。 用 户 感 兴趣 的 不 只 
是 内 容 ， 甚 至 包括 标签 和 其 他 用 户 。 加 之 ， 传 统 的 推荐 系统 通常 在 二 维 数据 上 操作 ， 而 
STS( 社 会 化 标签 系统 ，Social Tagging System) 的 数据 要 么 通过 三 维 数 组 来 表示 ， 要 么 由 
超 边 表示 的 超 三 角 图 (用 户 、 资 源 、 标 签 ) 来 表示 。 在 这 一 章 里 ， 我 们 系统 总 结 了 近年 来 在 
全 新 一 代 推 荐 系统 上 构建 的 社会 化 标签 系统 的 最 新 学 术 成 果 。 我 们 从 以 下 三 个 方面 着 手 总 
结 : 1) 用 于 社会 化 标签 系统 的 新 的 推荐 系统 方面 ， 如 用 户 、 资 源 和 标签 推荐 ;， 2) 解决 STS 
数据 三 元 特性 的 方法 和 算法 ; 3) 在 现实 的 STS 环境 中 部 署 推荐 系统 。 我 们 同时 对 已 有 工 
作 进 行 一 个 简单 的 对 比 ， 在 这 些 对 比 的 过 程 中 指明 新 的 研究 方向 。 


19.1 简介 


随 着 国内 通信 网 络 更 加 便宜 快速 、 电 子 化 设备 更 加 低廉 及 互联 本 身 所 具有 的 开放 性 ， 
一 种 新 的 Web 2. 0 应 用 也 雨后春笋 般 地 出 现 了 。 这 种 网 络 的 重要 思想 就 是 内 容 产生 的 方式 
更 加 分 散 ， 成 本 也 更 低 ， 这 促使 整个 网 络 向 着 更 加 开放 互联 民主 的 方向 发 展 。 在 这 一 章 
里 ， 我 们 主要 关注 Web 2.0 里 特殊 的 分 支 社会 化 标签 系统 (简称 STS)。STS 赋予 了 
每 个 普通 人 一 个 重要 的 角色 ， 他 们 不 仅 发 表 和 编辑 内 容 ， 而 且 更 重要 的 是 ， 他 们 产生 和 分 
享 轻 量 的 元 数据 ， 这 些 元 数据 是 用 户 自由 产生 的 关键 字 ， 这 些 关 键 字 称 为 标签 。 由 于 用 户 
通过 标签 和 资源 使 得 其 在 沟通 和 分 享 方面 产生 了 最 基本 的 条 件 ， 从 而 降低 了 协作 的 门槛 ， 
促进 形成 协同 的 轻 量 知识 体系 结构 “大 众 分 类 法 ”的 产生 。 最 著名 的 STS 网 站 有 Delicious? , 
BibSonomy? fll Last. fm 等 。Delicious AJ UYA E P KRÆ, BibSonomy 可 以 分 享 书 的 标 





Leandro Balby Marinho, Alexandros Nanopoulos, Lars Schmidt-Thieme, Information Systems and Machine 
Learning Lab (ISMLL), University of Hildesheim, Marienburger Platz 22, 31141 Hildesheim, Germany, 
http://www. ismll. uni-hildesheim. de, e-mail; (marinho, nanopoulos, schmidt-thieme) (2 ismll. uni- 
hildesheim. de 

Robert Jaaschke, Andreas Hotho, Gerd Stumme, Knowledge & Data Engineering Group( KDE), University 
of Kassel, Wilhelmsh’oher Allee 73, 34121 Kassel, Germany, http://www. kde. cs. uni-kassel. de, e- 
mail; (jaeschke, hotho, stumme}@cs. uni-kassel. de 
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翻译 : 邓 展 成 ， 佚 名 审核 ,吴涛 ， 胡 聪 ( 胡 户 主 ) 

日 ”大 众 分 类 这 个 术语 是 大 众 和 分 类 两 个 词 的 组 合 ， 也 就 是 由 普通 用 户 产生 并 维护 一 个 协同 分 类 系统 。 
© http://delicious. com/ 

© http://www. bibsonomy. org/ 

@ http://www. last. fm/ 
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签 和 文献 列表 ，Last. fm 则 可 以 分 享 音乐 。 这 些 系 统 具 有 容易 使 用 、 用 户 免费 自愿 参与 的 
特点 。 一 旦 一 位 用 户 登 录 了 ， 他 就 可 以 添加 一 个 资源 到 这 个 系统 ， 同 时 可 以 为 这 个 资源 打 
上 一 个 自 定义 标签 。 

如 果 一 方面 这 一 系列 应 用 带 来 了 新 的 机 会 ， 另 一 方面 则 也 会 使 得 一 些 旧 的 问题 重新 复 
现 ， 也 就 是 信息 过 载 。 上 百 万 的 用 户 和 独立 的 提供 者 以 一 种 不 可 控 的 方式 产生 了 大 量 的 内 
容 和 标签 冲击 着 STS， 这 样 降低 了 内 容 检 索 和 信息 分 享 的 能 力 。 最 好 的 解决 办 法 是 在 线 上 
推荐 系统 中 提高 相关 内 容 的 级 别 用 于 减少 不 断 产生 的 噪声 影响 。 然 而 在 STS 中 ， 我 们 面 
临 着 一 些 新 的 挑战 。 用 户 关注 的 不 只 是 发 现 内 容 ， 还 有 标签 甚至 其 他 用 户 。 加 之 ， 传 统 推 
荐 系统 通常 是 在 双向 数组 结构 上 完成 的 ， 用 大 众 分 类 法 (folksonomy) 数 据 要 么 通过 三 阶 数 
组 来 表示 ， 要 么 由 超 边 表示 的 超 三 角 图 (用 户 、 资 源 、 标 签 ) 来 表示 。 而 且 大 量 文献 中 广泛 
研究 基于 显 式 用 户 反馈 的 评级 预 估 ， 例 如 ， 用 数值 表示 一 个 用 户 对 某 个 物品 的 喜爱 程度 ， 
但 在 大 众 分 类 法 里 通常 没有 这 些 评估 值 。 这 也 是 我 们 开篇 就 开始 讨论 不 用 老 方 法 去 解决 重 
新 产生 的 问题 的 原因 。 在 某 种 程度 上 我 们 需要 分 析 传统 的 推荐 系统 是 否 适 应 STS。 

STS 是 一 个 新 的 研究 领域 ， 近 来 引起 了 很 大 的 重视 ， 这 通过 发 表 的 论文 L15，11，37， 
35，31] 数 量 不 断 在 增加 就 能 够 体现 出 来 ， 当 然 STS 也 在 不 断 地 发 展 成 长 。 实 际 上 的 大 规 
模 STS， 如 Delicious, BibSonomy 和 Last. fm 也 已 经 向 他 们 的 用 户 提供 了 相关 的 推荐 服 
务 ， 这 也 体现 出 STS 有 着 更 广泛 的 商业 用 途 。 在 这 一 章 我 们 将 以 最 简洁 的 方式 总 结 最 近 
在 推荐 系统 上 构建 STS 服务 的 最 新 工作 : 1) 用 于 社会 化 标签 系统 的 新 的 推荐 系统 方面 ， 
如 有 用户、 资源 和 标签 推荐 ; 2) 在 现实 的 STS 环境 中 部 署 推荐 系统 ; 3) 解 决 STS 大 众 分 类 
法 数据 三 元 特性 的 方式 和 算法 ; 4) 标 签 获 取 的 方式 。 同 时 重点 对 比 已 有 的 工作 ， 这 样 可 以 
为 我 们 的 研究 指明 方向 。 

本 章 结 构 如 下 : 19.2 节 描 述 大 众 分 类 法 的 特性 ， 同 时 分 析 传 统 推荐 系统 和 STS 的 不 
同 。19. 3 节 将 讨论 在 实际 STS 应 用 中 部 署 推荐 系统 的 难题 ， 同 时 以 BibSonomy 为 案例 进 
行 分 析 。19. 4 节 列 出 几 类 STS， 如 基于 图 /内 容 的 用 户 、 资 源 和 标签 推荐 算法 。19. 5 节 对 
比 讨论 第 18 章 给 出 的 算法 。 最 后 19. 6 节 总 结 分 析 这 个 领域 里 新 的 研究 方向 。 


19.2 社会 化 标签 推荐 系统 


大 众 分 类 法 是 STS 的 基础 构成 ， 由 用 户 给 内 容 标记 标签 进行 内 容 分 类 。 通 常 来 说 ， 
标签 是 通过 分 类 来 把 内 容 分 组 ， 按 主题 分 类 使 其 更 加 容易 浏览 。 这 是 一 个 网 站 最 基本 的 内 
容 管理 方式 ， 能 够 帮助 用 户 发 现 他 们 感 兴趣 的 内 容 。 注 意 ， 由 于 引进 了 标签 这 一 概念 ， 以 
前 传统 推荐 系统 广泛 采用 的 用 户 资源 双向 关联 ， 转 变 成 由 用 户 、 资 源 和 标签 组 成 的 三 元 
关联 。 

由 于 标签 是 用 户 自愿 主动 提供 的 ， 所 以 用 户 不 愿意 打 标 签 和 标签 量 迅速 增加 等 问题 也 
很 容易 暴露 出 来 。 在 本 章 中 我 们 将 看 到 最 可 能 解决 这 类 问题 的 方法 是 建立 STS。 如 果 对 标 
签 的 利用 合适 ， 那 么 标签 也 可 以 当 作对 内 容 个 性 化 信息 的 一 种 补充 ， 最 终 能 够 提高 资源 型 
推荐 系统 的 效果 。 在 我 们 探究 推荐 系统 如 何 利用 标签 提供 的 附加 信息 之 前 ， 我 们 需要 正式 
定义 大 众 分 类 法 和 它 的 数据 结构 ， 详 尽 阑 述 传统 推荐 系统 与 STS 的 区 别 ， 以 及 在 现实 
STS 中 部 署 推荐 系统 带 来 的 挑战 。 这 几 个 主题 将 在 下 面 讲述 。 


19.2.1 大 众 分 类 法 


GEÀ 大众 分 类 法 可 以 用 一 个 元 组 F=(U，T，R，Y) 来 表示 ， 其 中 
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e U TfeR 是非 空 有 限 集合 ， 它 们 分 别 表示 有 用户、 标签 和 资源 。 

e Y ZU, TfeR 的 三 元 关系 ， 其 中 YCUXTXR， 称 为 标签 分 配 。9 

用 户 通 常用 User ID 来 表示 ， 标 签 为 一 组 随机 字符 串 。 资 源 的 选择 需要 依赖 业务 系 
5t. fW. Delicious 中 的 资源 是 URL, m BibSonomy 是 URL 和 参考 文献 ，Last. fm 中 的 
资源 是 作曲 家 、 音 乐曲 目 和 专集 。 

大 众 分 类 法 有 不 同 的 表现 方式 。 在 19.4 节 将 讲解 每 一 种 展示 方式 会 产生 不 同 的 推荐 
算法 。 

大 众 分 类 法 表示 成 张 量 (Tensor) ”三 元 组 集合 Y 可 以 由 三 维 数组 表示 : AS laur) < 
Rlo|l xl7lx1s| 。 张 量 Y 有 不 同 的 表示 方法 ( 见 图 19. 1 左 侧 ) 。 例 如 ，Symeonidis 等 [35] 
提出 用 稀疏 矩阵 来 表示 YY， 其 中 1 表示 正 反 馈 ，0 表示 值 为 空 : 

D 1, (utsr) EY 
” lo, 其 他 

另外 ，Rendle 等 [26] 为 了 学 习 个 性 化 标签 排序 ， 区 分 了 正 / 负 样本 和 缺失 值 。 这 种 思 
想 是 正 负 值 产生 于 观察 到 的 标签 分 配 样本 。 观 察 标签 分 配 是 正 反馈 ， 而 对 已 经 打 完 标签 的 
非 观察 标签 分 配 为 负 反馈 。 其 他 情况 被 认为 是 空 值 。( 见 图 19. 1 右 侧 ) 


Qu, 





图 19.1 左 图 [35]: 0/1 稀 朴 矩阵 表示 表 ， 其 中 1 表示 正 反馈 ，0 表示 其 他 数据 。 右 图 [36]: 已 经 标记 资 
源 的 非 观察 标记 分 配 是 负 例 ， 其 他 为 空 


我 们 需要 注意 的 是 ， 不 同 于 典型 推荐 
系统 ， 大 众 分 类 法 没有 一 种 数值 评分 来 表 
示 用 户 对 某 个 给 定 的 资源 或 标签 的 爱好 
程度 。 

大 众 分 类 法 表示 成 超 图 (hypergraph) 
相 类 似 ， 超 图 也 是 大 众 分 类 法 的 直观 表示 ， 
是 一 个 三 元 无 向 超 图 : G:=(V, E), HH 
V:-UUTUR 是 节点 集合 , E:— (s t, 
r} |(u,，t，r)EY} 是 超 图 的 集合 ( 见 图 19.2 大 众 分 类 法 的 三 元 无 向 超 图 表示 法 
图 19. 2)。 


19.2.2 传统 推荐 系统 范式 


推荐 系统 是 一 个 软件 应 用 ， 其 目标 是 基于 用 户 信息 来 预测 用 户 对 某 个 特定 资源 的 兴趣 
度 ， 用 户 信息 包括 用 户 的 历史 访问 购买 信息 、 资 源 排名 、 点 击 流 数据 、 人 口 统计 信息 等 。 





O ”在 最 初 的 定义 里 [12]， 额 外 引入 了 子 标签 / 父 标签 的 关系 ， 我 们 在 这 里 忽略 了 。 这 里 采用 的 版 本 在 形式 概念 
分 析 [7] 中 称 为 三 元 环境 [21，34]。 
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推荐 系统 通常 用 来 预测 资源 排名 或 者 推荐 给 用 户 最 喜欢 的 资源 列表 。 传 统 来 说 ， 给 定 m 个 
用 户 和 ?个 资源 ， 用 户 信息 用 一 个 稀疏 用 户 资源 矩阵 XER"”" U{. } 来 表示 ， 其 中 (.} 表 示 
值 为 空 。 这 个 矩阵 分 解 成 多 个 行 向 量 : 
Xi 一 [x rn), x = [Lr Td), u: = ,em 
其 中 zu 表示 用 户 w 对 资源 -的 评分 ，zurER。 每 个 行 向 量 x, 对 应 一 个 用 户 信 息 ， 
表示 某 个 特定 用 户 对 资源 的 评分 。 这 种 矩阵 分 解 经 常 采用 一 种 利用 用 户 与 用 户 的 相似 度 
的 算法 ， 例 如 ， 著 名 的 基于 用 户 的 协同 过 滤 算 法 (CF)L27]j。 和 矩阵 也 可 以 通过 列 向 量 来 
表示 : 
Vy = Deomm], xa = [aos Tr = Lean 
其 中 每 一 列 向 量 X, 对 应 的 是 m 个 用 户 对 某 一 特定 资源 的 评价 。 这 种 表示 方式 通常 利 
用 物品 与 物品 之 间 的 相似 度 ， 采 用 相应 的 基于 物品 的 协同 过 滤 算 法 [3]。 对 于 基于 近邻 的 
推荐 算法 的 总 结 可 详 见 第 4 章 。 
注意 ， 由 于 大 众 分 类 法 的 三 方 关系 特性 ， 传 统 的 推荐 系统 很 难 直 接 适应 。 因 此 为 了 开 
发 出 适合 大 众 分 类 法 的 推荐 系统 ， 需 要 满足 以 下 条 件 之 一 : 1) 采 用 传统 推荐 算法 把 三 元 关 
系 Y 降 维 ， 映 射 到 低 维 空间 (通常 是 二 维和 矩阵 ) 中 ; 2) 或 者 在 三 阶 和 矩阵 或 三 元 无 向 超 图 上 搭 
建 一 个 新 的 推荐 算法 。 如 果 采 用 方案 一 必须 注意 由 于 降 维 引起 的 重要 数据 的 丢失 ， 这 样 会 
降低 整个 推荐 系统 的 准确 度 。 在 19. 4 节 将 详细 讨论 这 两 类 算法 。 


19.2.3 多 模式 推荐 


不 同 于 传统 的 推荐 系统 范式 一 一 它们 关注 的 要 么 是 排名 预测 ， 要 么 是 资源 推荐 ，STS 
用 户 可 能 对 发 现 资源 /标签 甚至 其 他 用 户 感 兴趣 ， 还 有 这 类 推荐 可 以 提供 各 种 实体 类 型 。 

标签 推荐 已 经 用 于 Delicious 和 BibSonomy 等 系统 中 。 其 中 包括 基于 其 他 用 户 在 对 相 
同 资源 提供 的 标签 ， 向 用 户 推 荐 标签 。 标 签 推 荐 把 物品 的 不 同 信 息 展示 给 用 户 ， 同 时 也 免 
除 用 户 为 了 得 到 一 些 好 的 标签 列表 而 需要 做 一 些 令 人 厌烦 的 工作 。 而 且 标 签 推荐 可 以 减少 
用 户 不 愿 做 标签 引起 的 标签 矩阵 稀 朴 问题 。 图 19. 5 说 明 BibSonomy 系统 中 标签 推荐 。 

有 别 于 传统 的 推荐 系统 ， 最 需要 注意 的 一 点 是 ， 它 不 是 用 于 反复 购买 行为 ， 例 如 ， 用 
户 不 会 两 次 都 买 一 本 相同 的 书籍 、 电 影 、CD 等 ， 而 重复 性 标签 是 STS 的 共同 特点 。 标 签 
可 以 用 于 标注 一 个 资源 ， 也 可 以 标记 另 一 种 不 同 的 资源 。 也 就 是 说 ， 传 统 的 推荐 系统 只 会 
向 用 户 推荐 用 户 未 买 过 或 未 评分 过 的 物品 ，STS 最 终 也 会 向 用 户 推荐 他 在 其 他 资源 中 使 用 
过 的 标签 。 

资源 推荐 广泛 用 于 电子 商务 和 广告 ， 如 亚马逊 网 站 。 随 着 STS 越 来 越 流行 ， 许 多 现 
行 的 资源 推荐 服务 同样 可 以 利用 标签 提高 推荐 的 质量 ， 如 基于 其 他 类 似 用 户 的 共同 标签 向 
用 户 推荐 资源 。 在 视频 推荐 网 站 movielens? 上 有 一 个 著名 的 案例 :用户 对 自己 喜爱 的 电影 
进行 评分 ， 同 时 收 到 其 他 他 们 可 能 感 兴趣 视频 的 推荐 。 它 起 初 是 在 典型 的 用 户 评分 二 维 矩 
阵 上 完成 相关 传统 推荐 服务 ， 而 最 近 添 加 了 社会 化 标签 特性 ， 在 上 面 可 以 开发 或 部 署 对 标 
签 敏感 的 新 算法 [30] 。 

第 三 类 推荐 应 用 的 重点 关注 向 目标 用 户 推荐 感 兴趣 的 用 户 ， 这 样 可 以 帮助 用 户 与 有 共 
同 爱好 的 人 建立 关系 ， 鼓 励 他 们 贡献 和 分 享 更 多 的 内 容 。 在 这 里 ， 感 兴趣 的 用 户 是 指 那些 
与 目标 用 户 有 相似 信息 的 用 户 。 例 如 ， 如 果 一 个 标签 频繁 被 许多 人 使 用 ， 那 么 这 些 人 隐 式 
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地 形成 了 一 个 有 着 共同 兴趣 的 用 户 群 ， 即 使 他 们 没有 任何 地 理 上 或 者 网 络 上 的 联系 。 这 个 
标签 就 可 以 标示 这 个 用 户 群 的 共同 兴趣 。 

每 一 种 推荐 模式 ， 如 标签 、 资 源 或 者 用 户 ， 都 是 有 意义 的 ， 当 然 它们 都 需要 依赖 特定 
应 用 环境 。 有 些 算 法 能 够 提供 集成 多 种 模式 推荐 ， 它 们 与 那些 努力 实现 多 种 特定 模式 推荐 
系统 是 一 样 很 吸引 人 的 。 


19.3 现实 社会 化 标签 推荐 系统 
19.3.1 有 哪些 挑战 


对 于 一 个 推荐 系统 要 在 一 个 现实 应 用 中 取得 成 功 ， 它 一 定 要 面临 一 些 挑战 。 第 一 ， 所 
提供 的 推荐 必须 要 符合 应 用 场景 。 例 如 ， 标 签 应 该 描述 被 标注 的 资源 和 产品 ， 应 该 能 够 吸 
引用 户 的 兴趣 ， 所 荐 资源 也 应 该 是 令 人 感 兴趣 的 并 且 是 相关 联 的 。 第 二 ， 建 议 应 该 是 可 以 
描述 的 ， 这 样 用 户 更 易 知 道 为 什么 会 向 他 推荐 这 些 东 西 。 第 三 ， 它 们 必须 可 以 快速 传递 给 
用 户 ， 必 须 方便 查看 (例如 ， 人 允许 用 户 点 击 它们 或 者 在 输入 标签 时 可 以 自动 补 全 )。 最 后 ， 
推荐 系统 要 保证 推荐 不 要 影响 系统 的 正常 使 用 。 

在 这 一 节 里 ,我 们 把 标签 推荐 作为 STS 推荐 实例 。 大 部 分 STS 包含 一 个 标签 推荐 器 ， 
在 用 户 正 在 给 某 个 资源 作 标注 时 ， 它 把 一 些 标签 推荐 给 用 户 。 正 在 被 推荐 的 标签 有 着 多 种 
A. 例如， 增加 资源 被 标注 的 机 会 ， 提 醒 用 户 资源 是 什么 ， 扩大 用 户 的 标签 词典 。 而 
且 ， 正如 Sood 等 [33] 指 出 标签 推荐 “从 产生 到 认识 都 从 根本 上 改变 了 打 标签 的 过 程 ”， 这 

只 需要 更 少 认 知 努力 和 时 间 。 

更 正式 地 ， 给 定 一 个 用 户 u 和 一 个 资源 +， 标 签 推荐 任务 是 预测 标签 tags Qo, r), X 
预测 标签 是 该 用 户 为 一 个 资源 分 配 的 标签 。 我 们 用 个 (uw，r) 表 示 推 荐 标签 的 (有 序 ) 集 合 。 
尽管 在 用 户 登 录 自 己 的 账号 时 我 们 没有 给 标签 排序 ， 推 荐 系统 给 出 的 标签 顺序 对 系统 评估 
有 着 很 重要 的 作用 。 


19.3.2 案例 BibSonomy 


19.3.2.1 系统 简介 
BibSonomy 起 源 于 Kassel 大 学 9 知识 与 数据 工程 项 目 组 2005 年 春季 的 一 个 学 生 项 目 。 
项 目的 目的 是 构建 一 个 系统 ， 该 系统 通过 一 种 类 似 于 Delicious 书签 方式 把 BIBTEX[25 ]2& 
组 织 起 来 ，Delicious 书签 方式 在 那 时 就 越 来 越 受 欢迎 。BIBTEX 是 一 种 流行 的 LATEX 
[20] 文 献 管理 系统 ， 因 为 许多 研究 人 员 用 LATEX 写 科研 论文 。 在 把 书签 作为 第 二 类 资源 
整合 到 该 系统 之 后 直到 项 目 完成 ，BibSonomy 在 2005 年 底 对 外 开放 以 供 访问 一 一 初期 只 
提供 给 同事 访问 ， 后 来 在 2006 年 正式 全 面 开放 。 
19. 3 是 BibSonomy 一 个 书签 位 的 详细 视图 。 第 一 行书 签 标题 加 粗 ， 超 链接 是 该 书 
签 的 URL。 第 二 行 是 展示 一 条 可 选 描述 
信息 ， 用 户 可 以 把 该 描述 信息 分 配给 任 
何 一 篇 文章 。 最 后 两 行 是 一 起 的 并 且 提 
供 了 详尽 信息 : 其 中 包括 用 户 赋 给 这 篇 
文章 的 所 有 标签 (web，service，tutori- . 图 19. 3 单个 书签 位 的 展示 细节 













REST web services 
Good intro to the REST "architecture" 
to web service tutorial guidelines api rest by hotho and 3 other 


people on 2006-04-04 16:11:47 GOpy. 
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al, guidelines 和 api); 以 及 给 这 篇 文章 打 书签 的 某 位 用 户 的 用 户 名 (hotho) 及 多 少 用 户 给 
该 文章 作 标 签 等 信息 。 这 部 分 都 有 超 链接 引导 用 户 去 往 对 应 的 标签 页 、 用 户 页 及 展示 该 资 
源 所 有 四 篇 文章 的 列表 页 它 列 出 hotho 的 文章 及 其 他 三 位 的 文章 。 发 布 文章 的 页 面 结 
” 构 也 非常 相似 ， 如 图 19. 4 所 示 。 
19. 3.2.2 BibSonomy 推荐 


为 了 帮助 用 户 更 加 方便 地 打 标 签 ，Bib- 
Sonomy 含有 标签 推荐 功能 (图 19.5)。 当 用 
户 发 现 了 一 篇 有 趣 的 页 面 (或 者 出 版 物 )， 张 
贴 到 BibSonomy, 3f A x 4t tk AW» rr 
至 少 提供 10 条 推荐 标签 。 图 19.4 发 布 页 的 展示 细节 











Semantic Network Analysis of Ontologies 
Bettina Hoser and Andreas Hotho and Robert Jaschke and 
Christoph Schmitz and Gerd Stumme. Procsedings of the 3rd 
European Semantic Web Conference \emph{(accepted for 
publication)} (2008) 

to web 2006 social ontology myown semantic analysis network 
sna by hotho and 1 other person on 2006-04-06 21:32:23 pick 
copy URL BibTeX 


BibSonomy:: edit bookmark - lceweasel 


i Datei Bearbeiten Ansicht Chronik Lesezeichen Extras Hilfe 2 


j BibSonomy :: edit bookmark 


i tags * relations - groups * popular logged in as jaeschke - help - blog * about 
| myBibSenomy - post bookmark * post bibtex 10 picked in basket * edit tags * settings * logout 
; a 

: Feel free to edit your bookmark iu i 

{ -tags 

f url” fhttptwww insna.org/INSNA/soft_iof.htmi (atph | hey) (coud pnw) (rruntray ! | 
i Š ~ 25) 

; tite’ [links to Software for Network Analysis E 

; description, ime ‘For Social Network baelysis ————————— 











i comment 








; tags” fanatysis graph network sna socia! visualization space ose 
separated on 
; [recommendatior: social network software analysis visualization graph sna science 


| suggested 
i viewable for [public sj] save 





Æ 19.5 BibSonomy 书签 标注 过 程 的 标签 推荐 


19.3.2.3 技术 及 基础 设施 的 要 求 


为 BibSonomy 实现 一 个 推荐 服务 需要 处 理 如 下 几 个 问题 : 

首先 ， 推 荐 算法 产生 有 效 的 推荐 需要 获得 足够 的 数据 是 重要 的 必 备 条 件 之 一 ， 它 在 设 
计 阶 段 就 需要 得 到 解决 。 推 荐 服务 需要 访问 用 户 正 在 发 帖 ( 例 如 ， 资 料 填写 完成 并 且 正 在 
通过 AJAX 技术 加 载 推 荐 数据 ) 的 系统 数据 库 。 全 部 数据 一 一 如 文档 的 全 部 文本 一 一 需要 
用 于 解决 冷 启动 问题 (如 基于 内 容 的 推荐 ) 。 这 种 系统 必须 能 够 处 理 相 当 大 的 数据 ， 迅 速 选 
择 出 相关 子 集 并 且 提 供 预 处 理 。 

已 有 的 硬件 条 件 和 期 望 的 数据 量 限制 推荐 算法 的 选择 。 尽 管 一 些 推 荐 算法 允许 推荐 数 
据 的 (部 分 ) 提 前 计算 。 这 就 需要 使 用 多 余 的 内 存 ， 在 线 上 计算 时 可 能 得 不 到 理想 的 结果 。 
硬件 和 网 络 基 础 设施 必须 保证 短 时 间 内 把 推荐 数据 传递 给 用 户 ， 而 没有 太 大 的 延迟 。 同 时 
需要 提供 一 个 简单 无 打扰 的 用 户 界 面 保证 系统 可 用 。 

系统 更 高 阶 方面 的 需求 也 必须 考虑 ， 例 如 ， 用 户 事件 的 日 志 接 人 (如 点 击 、 键 盘 按 键 
等 )， 用 于 有 效 地 验证 线 上 配置 上 已 使 用 的 推荐 算法 。 同 时 也 需要 实时 验证 推荐 效果 ， 使 
得 能 够 手动 调整 结果 选择 策略 去 为 用 户 或 资源 动态 选择 (目前 ) 最 好 的 推荐 算法 。 多 种 算法 
连同 简单 包含 外 部 推荐 服务 (通过 一 种 开放 推荐 接口 ) 的 多 路 复 用 技术 是 BibSonomy 系统 
里 面 最 近 开 发 的 一 种 技术 。 
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19. 3. 3 标签 获取 


标签 的 质量 可 以 直接 影响 STS 的 推荐 性 能 。 尽 管 大 众 分 类 法 代表 的 是 群体 智慧 ， 社 
会 标签 带 来 了 一 系列 问题 ， 例 如 标签 稀疏 性 (用 户 倾向 于 提供 有 限 的 标签 数量 ) ， 一 词 多 义 
(标签 有 多 种 解释 结果 )， 或 者 标签 特质 ( 按 用 户 自己 的 意思 编写 标签 ， 如 “未 读 ” 等 )。 所 有 
这 些 问题 都 会 影响 推荐 的 质量 。 由 于 这 个 原因 ， 我 们 换 了 一 种 方式 获取 标签 。 这 能 够 帮助 
我 们 更 好 地 分 清 社 会 标签 流程 中 的 优点 和 缺点 。 然 后 我 们 会 检查 直面 这 些 标签 获取 方法 的 
好 坏 。 

。 专家 标签 : 这 种 方法 主要 是 依赖 一 小 部 分 该 领域 的 专家 ， 他 们 标注 资源 用 途 ， 主 

要 是 构造 词汇 。 专 家 提供 的 标签 客观 ， 涵 盖 面 广 。Pandora 系统 是 一 个 著名 的 例 
子 。 专 家 在 上 面 给 音乐 资源 做 标签 。 采 用 专家 的 好 处 是 一 组 共同 接受 的 标签 词汇 。 
当然 ， 这 需要 大 量 的 人 工 操 作 ， 费 力 耗 时 且 成 本 高 昂 。 

。 基于 标注 游戏 的 标签 : 像 ESPGame 这 样 具 有 一 定 目的 性 的 游戏 (GWAP)[39] 是 

一 种 突破 性 的 想法 ， 它 是 通过 游戏 使 用 户 达 到 标注 目的 。 两 个 参与 者 同时 观察 同 
张 图 片 ， 要 求 他 们 填 人 标签 ， 直 到 他 们 俩 都 填 人 了 相同 标签 。 伴 随 着 ESPGame 游 
戏 的 成 功 ， 其 他 类 似 应 用 在 音乐 领域 的 游戏 (如 ListenGame 9 ) 也 相继 出 现 了 。 正 
如 社会 标签 ， 游 戏 开发 “人 类 的 计算 能 力 ”。 通 过 两 人 或 者 多 人 组 合 ， 这 种 标签 结 
果 集 也 有 很 高 的 准确 度 。 这 种 游戏 的 问题 是 游戏 参与 者 如 果 为 了 得 高 分 ， 那 么 可 
能 会 降低 标签 质量 。 例 如 ， 他 们 也 许 在 更 具体 的 情况 下 填写 更 公共 的 标签 ， 这 样 
会 增加 匹配 的 概率 。 

。 基于 内 容 的 标签 技术 : 像 URL、 音 频 等 这 样 的 资源 含有 丰富 的 内 容 。 通 过 在 网 页 
上 疏 取 相关 信息 并 且 把 这 些 数 据 转换 成 适当 的 表示 方式 ， 标 签 可 以 通过 数据 挖掘 
算法 产生 。 例 如 ， 在 ECML PKDD 发 现 频道 2008 的 标签 推荐 任务 里 ， 一 些 在 测 
试 集 上 预测 的 标签 在 测试 集 里 面 没 有 出 现 ， 这 样 需要 强制 用 户 采 用 资源 的 文本 内 
容 产 生 新 的 标签 。 在 音乐 领域 ， 这 种 方法 称 为 自动 标 答 技术， 通常 被 用 于 避免 冷 
启动 问题 L5]。 基 于 内 容 标签 的 好 处 是 不 需要 用 户 直接 参与 这 个 打 标签 过 程 。 坏 处 是 
这 样 的 标签 方式 会 产生 噪声 ， 计 算 密 集 型 ， 用 户 被 强制 接受 通过 算法 产生 的 标签 。 

对 比 上 述 方法 ， 社 会 化 标签 技术 有 利于 产生 大 规模 标签 数据 集合 。 大 量 标签 用 户 通 常 
能 够 提高 标签 的 质量 。 然 而 ， 社 会 化 标签 技术 很 容易 出 现 冷 启动 问题 ， 因 为 新 的 资源 很 少 
被 打 标签 。 在 表 19.1 中 我 们 总 结 了 上 述 方法 的 优 缺 点 。 


表 19.1 标签 收集 方法 的 特点 
TERR. AX. WRA 
TENA, TERAMAN 
^ua. BTA 
we. Xem 





http://www. pandora. com/ 

http://www. gwap. com/gwap/gamesPreview/ 
http://www. listengame. org/ 

http; // www. ked. cs. uni-kassel. de/ws/rsdc08/. 
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尽管 社会 化 标签 技术 很 容易 出 现 特质 化 、 稀 朴 性 和 冷 启 动 等 问题 ， 然 而 大 量 标签 用 
户 通常 能 够 提高 标签 的 质量 。 而 且 社会 化 标签 系统 (如 同 标 注 游戏 一 样 ) 表 示 的 用 户 计算 
范式 有 着 巨大 的 能 力 去 解决 基于 内 容 的 推荐 机 制 在 标签 获得 上 其 本 身 无 法 解决 的 问题 。 
但 是 不 像 计 算 机 ， 人 需要 一 些 刺 激 才 会 成 为 这 种 通过 标签 推荐 提供 的 集体 计算 的 一 
部 分 。 


19.4 社会 化 标签 系统 的 推荐 算法 


正如 我 们 在 19. 2 节 所 指出 的 ， 有 一 些 大 众 分 类 法 的 特性 需要 在 设计 推荐 系统 前 加 以 
考虑 ， 如 : 
© 公众 分 类 数据 被 表示 成 “ 张 量 ” 或 者 三 重 无 向 超 图 (tripartite undirected hyperg- 
raph) 。 因 此 ， 我 们 要 么 对 数据 做 变换 以 适应 传统 的 推荐 算法 ， 要 么 对 现 有 算法 进 
行 扩展 使 其 可 作用 于 张 量 或 者 超 图 数据 。 | 
。 使 用 大 众 分 类 法 的 用 户 可 能 会 对 “多 模式 推荐 ” 感 兴趣 ， 因 此 ， 那 些 支持 所 有 模式 、 
且 在 模式 切换 过 程 中 不 产生 变化 或 者 仅 产 生 细微 变化 的 算法 是 理想 所 需 。 
。 大 众 分 类 法 支持 多 媒体 资源 。 因 而 ， 基 于 内 容 的 算法 应 能 有 效 将 内 容 信息 整合 人 
大 众 分 类 法 的 数据 结构 中 。 
在 本 节 中 ， 我 们 阐述 社会 化 标签 推荐 系统 中 当下 一 些 主流 方法 ， 展 示 和 探讨 它们 是 如 
何 处 理 上 述 问题 的 。 


19.4.1 协同 过 滤 


协同 过 滤 是 最 常用 并 成 功 地 应 用 于 个 性 化 系统 的 方法 之 一 ， 有 着 大 量 且 持 续 活路 的 文 
献 ( 见 第 4 章 和 第 5 章 )。 大 体 上 说 ， 这 种 算法 匹配 出 兴趣 相同 的 人 来 进行 推荐 。 正 如 
19. 2. 2 节 中 指出 的 ， 传 统 的 推荐 系统 通常 运 
用 于 “表示 用 户 与 资源 之 间 二 元 关系 ”的 二 阶 
张 量 上 。 因 此 ， 由 于 大 众 分 类 法 的 三 元 关系 性 
质 ， 传 统 的 协同 过 滤 算 法 不 能 直接 应 用 ， 除 非 
三 元 关系 被 降 到 一 个 低 维 空间 [24]。 为 此 ， 就 
“基于 用 户 的 协同 过 滤 ? 来 说 ， 和 矩阵 可 以 选择 以 
下 两 个 2 维 映 射 之 一 : 1) 若 存在 i:€ T， 使 得 "T e 
(us t, D € Y, ma Y € (0, 1)! X151, gy TE Ts 
CRY) :一 1， 否 则 为 0， DRE ER, fi 
得 (u, t, NEY, mrYE{0, 1)!"!*!T!, W a 
GurY),, 571, BMA 0, SAB 19.6, 最 0L SLUT 
后 ， 你 也 可 以 考虑 “资源 -标签 ”投影 矩阵 ， 这 
将 引 向 “ 非 个 性 化 的 基于 内 容 的 模型 ”。 

这 些 映射 保留 了 用 户 信息 ， 引 向 基于 “资源 -用 户 ” 或 者 “标签 -用 户 ” 的 推荐 系统 。 

请 注意 ， 在 这 里 ， 形 成 “一 个 用 户 的 近邻 "Nt 有 两 个 可 能 的 设 定 方法 ， 以 资源 作为 
对 象 或 者 以 标签 作为 对 象 。 有 了 定义 好 的 矩阵 X， 并 决定 了 使 用 nY 或 xurY 来 用 于 计算 
用 户 的 近邻 ， 我 们 就 有 了 应 用 协同 过 滤 方 法 所 需 的 设置 。 首 先 ， 我 们 基于 行 分 解 的 矩阵 区 





19.6 ”映射 到 “用 户 的 资源 "和 “用 户 的 标签 ”空间 
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和 一 个 给 定 ， 来 计算 和 用 户 u 最 相似 的 个 用 户 的 集合 N4， 

Niras argmaxsim (x, sx,) (19.1) 
其 中 ，argmax 函数 的 上 标 表示 要 返回 的 近邻 数 EC N; sim 是 任何 含义 清晰 的 相似 性 度量 ， 
例如 通常 的 余弦 相似 性 度量 sim. xD: = 


多 模式 推荐 (Multi-mode Recommendation) 有 了 计算 好 的 近邻 ， 我 们 就 可 以 为 一 个 给 定 
的 用 户 w， 一 个 给 定 的 资源 r 和 某 个 n€ N 提取 出 及 个 推荐 标签 的 集合 个 (wu，r)， 如 下 : 


lu,r) : = argmax > sim(x, ,x,)óCv,.t,r) (19. 2) 
t€ 4 
ve NE 


HH, #0, t, OEY, Ww, t, 72 :—1, BWX 0. 

如 果 你 想 推荐 资源 ， 可 以 使 用 类 似 的 方法 。 请 注意 ， 如 果 我 们 只 使 用 xugY RB, 
用 标准 的 基于 用 户 的 协同 过 滤 算 法 就 可 以 了 ( 见 式 (19. 3)) 。 但 既然 标签 能 够 提供 有 关 用 户 
兴趣 的 额外 信息 ， 它 们 最 终 可 以 提升 推荐 的 质量 ， 就 应 当 加 以 利用 。 一 个 很 简单 的 感知 标 
签 的 推荐 方法 是 基于 xurY 投影 矩阵 来 计算 用 户 近邻 ， 并 聚合 这 些 近 邻 的 资源 来 生成 推荐 
列表 。 文 献 [6j 提 出 了 一 个 类 似 想法 ， 通 过 提取 资源 的 推荐 列表 ， 第 一 次 采用 “用 户 -标签 ” 
投影 矩阵 nur Y 来 计算 出 一 个 标签 的 有 序列 表 。 然 而 ， 仅 单独 使 用 xurY， 所 述 资源 信息 被 
ERT; 在 这 里 ， 资 源 信息 是 用 户 兴趣 的 关键 模式 。 在 这 个 意义 上 说 ， 我 们 需要 找到 一 种 
方法 ， 以 适应 folksonomy2 路 数据 结构 中 的 所 有 三 种 模式 ， 从 而 可 以 应 用 标准 的 协同 过 
UE. Tso-Sutter 等 [37] 提 出 了 一 种 方法 ， 利 用 标签 将 典型 的 “用 户 -资源 ”和 矩阵 扩展 出 伪 用 
户 和 伪 资 源 ( 见 图 19.7)。 请 注意 ， 在 这 种 方式 中 ， 用 户 / 资 源 信息 (user/resource profile) 
被 自动 用 标签 加 以 充实 ; 该 文 接着 提出 一 种 融合 算法 ， 在 扩展 矩阵 上 合并 基于 用 户 的 协同 
过 滤 (UCF) 和 基于 物品 的 协同 过 滤 (ICF) 的 预测 。 回 想 一 下 ， 在 用 标准 的 基于 用 户 的 协同 
过 滤 进 行 资源 预测 时 ， 一 个 给 定 用 户 u 对 某 个 资源 x 的 兴趣 度 分 值 计算 为 : 与 资源 ~ 共 现 
的 近邻 用 户 的 归 一 化 数目 ， i 


P tsr = 1) oS | {vE N, |z.. = 1} | 


N, 
对 于 用 基于 物品 的 协同 过 滤 来 进行 资源 预测 ， 文 献 [3] 提 出 了 算法 : 一 个 给 定 用 户 “对 
某 个 资源 -的 兴趣 度 分 值 计算 为 : r 和 “与 共 现 的 7 那些 近邻 资源 ”的 相似 度 的 平均 总 和 


(19. .3) 


P1: 5$ sm (19. 4) 
(r EN, Iz, =1) 
融合 以 上 两 种 分 值得 到 
ucf = icf z5 
pit = hia f Se moi, EN te 
3 ptr. m1) Sip" = 1) 


其 中 ,4 只 是 一 个 控制 ucf 和 icf 影响 比例 的 参数 。 请 注意 ， 由 于 uct 和 icf 计算 出 的 预 
测 列表 的 分 值 以 不 同 的 单位 来 度量 (ucf 用 的 是 物品 的 频 度 ， 而 icf 用 的 是 物品 的 相似 度 )， 
预测 分 值 做 了 归 一 化 。 对 于 某 个 mwEN，Top-N 推荐 列表 接着 这 样 生成 ， 

arg maxp™ (xz, = 1) (19. 6) 

Wetzker 等 [41] 提 出 了 类 似 的 想法 ， 对 概率 潜在 语义 分 析 (PLSA) 模 型 [10] 进 行 标签 
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扩展 来 做 资源 推荐 。 在 标准 PLSA 中 ， 一 个 资源 和 一 个 给 定 用 户 共 现 的 概率 可 算 作 


PG|u) := DyP(r|z)P(z|u) (19. 7) 
其 中 ，Z : = 二 {zi1，…，z,) 是 一 个 隐藏 主题 变量 ， 它 被 假定 为 观察 到 的 用 户 和 资源 之 间 

共 现 分 布 的 起 源 。 于 是 假定 资源 与 标签 共 现 的 起 源 是 同样 的 隐藏 主题 。 
P(r|t) := >)P(rlz)P(2z|t) (19. 8) 


两 个 模型 有 公共 因子 P(r|z)， 通 过 最 大 化 对 数 似 然 函 数 
L:— DADf rlogPrla) + 1—A $]f6G,DlogPG|D] — (9.9) 


将 两 个 模型 结合 起 来 。 其 中 ，f(u，r) 对 应 资源 和 用 户 的 共 现 次 数 ，f(r，1) 对 应 资源 和 标 
签 的 共 现 次 数 ，4 是 一 个 预先 定义 的 权重 ， 用 于 平衡 各 个 模型 的 影响 。 常 见 的 期 望 最 大 化 
(Expectation-Maximization，EM) 算 法 用 来 对 模型 做 最 大 似 然 估计 。 对 于 一 个 给 定 的 用 户 
u， 各 个 资源 按照 概率 P(rlu)( 见 式 (19.7)) 赋 权 并 排序 ， 排 序 靠 前 的 资源 最 终 被 推荐 。 

如 果 要 推荐 用 户 ， 我 们 可 以 基于 xurY EX onus Y 来 推荐 近邻 用 户 。 考 虑 folksonomy 的 
三 种 模式 来 推荐 近邻 ， 你 可 以 ， 举 例 说 ， 使 用 [37] 提 出 的 矩阵 扩展 (参见 图 19.7, 或 者 基 
于 “用 户 - 资 源 ” 和 “用户 -标签 ”映射 矩阵 计算 用 户 相 似 度 的 线性 组 合 。 





图 19.7 扩展 "用户 一 资源 "矩阵 : 水 平方 向 加 入 标签 作为 伪 资 源 和 垂直 方向 加 入 标签 作为 伪 用 户 


关于 复杂 性 鉴于 整个 输入 矩阵 需要 保存 在 内 存 中 ，CF 通常 面临 扩展 性 问题 。 在 
STS， 你 可 能 不 得 不 最 终 在 内 存 中 保留 一 个 以 上 和 矩阵， 保留 几 个 取决 于 你 想 要 使 用 哪些 映 
射 。 为 了 做 推荐 计算 ， 我 们 通常 需要 进行 三 个 步 又， 

1 映射 计算 : 为 了 得 到 映射 我 们 需要 确定 使 用 (4，r)、(u，, ORG, OFM. WF 
这 一 点 ， 我 们 需要 在 Y 上 做 线性 扫描 。 

2. 近邻 计算 : 在 传统 的 基于 用 户 的 CF 算法 中 ,计算 近邻 N, 的 复杂 度 和 用 户 数量 呈 
线性 关系 ， 因 为 你 需要 计算 一 个 给 定 的 测试 用 户 和 数据 库 中 所 有 其 他 用 户 的 相似 度 。 此 
外 ， 我 们 还 要 按 相 似 程 度 排序 ， 以 确定 K 近邻 。 

3. 进行 推荐 : 对 一 个 给 定 测试 用 户 做 Top-N 标签 (或 资源 ) 推 荐 ,我 们 需要 ，1) 计 算 
标签 (或 资源 ) 与 近邻 用 户 N, 的 共 现 次 数 ; 2) 依 据 与 相应 近邻 用 户 的 相似 程度 ， 对 每 个 共 
现 赋 权 ; 3) 根 据 标 签 ( 或 资源 ) 的 权重 对 其 排序 (例如 式 (19. 2))。 


19. 4.2 基于 排序 的 推荐 
下 面 介 绍 基 于 排序 分 值 的 推荐 算法 ， 这 点 是 从 网 页 排序 受到 启发 的 。 它们 共同 的 特点 
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是 ， 分 值 是 依据 从 底层 的 大 众 分 类 数据 结构 中 提取 光谱 属性 (spectral attributes) 来 计算 
的 。 然 而 ， 用 不 同 的 方式 表示 大 众 分 类 ( 见 19. 2. 1 节 ) 会 导致 不 同 的 基于 排序 的 算法 。 
19. 4. 2. 1 基于 张 量 分 解 进 行 排序 

以 张 量 表示 Y， 就 可 以 利用 由 用 户 、 标 签 和 资源 形成 的 多 路 关联 (multi-way correla- 
tions) 的 4 内 底层 潜 语 义 结构 来 做 推荐 。 这 可 以 通过 基于 张 量 分 解 的 推荐 算法 来 实现 ， 见 
文献 [26，35，43]。 这 种 算法 可 以 有 效 地 检测 出 多 路 关联 ， 带 来 性 能 改善 。 第 5 RAR 
几 个 用 于 评分 预测 问题 的 最 先进 的 矩阵 分 解 ( 即 二 阶 张 量 分 解 ) 方 法 。 

A 的 分 解 表示 如 下 ( 见 图 19. 8): 

A: = CX,ÜX, TX. R (19. 10) 
RK'BPÜCR'""*, PERT”, ReR'* "4 9l & Xo FP. EUR. ENR IER 
阵 ， 其 中 潜在 维度 Ry. ka. kr BE); CC R'v er EARR R E AL 2L I8] HHA 
张 量 ， 称 为 核心 张 量 。 符 号 Xi RmKEAeEHNi 模 乘 积 。 于 是 待 学 习 的 模型 参数 是 四 
元 组 0: =, Û, 六， 休 ) 。 这 种 分 解 是 指 被 称 为 Tucker 分 解 (Tucker Decomposition, J& 
克 分 解 )[18j 的 通用 分 解 模型 。 参 数学 习 之 后 ， 可 以 如 下 进行 预测 : 
rt = >) D tures dae e Pnr e bye (19. 11) 
其 中 ， 特 征 和 矩阵 的 特征 维度 坐标 (indices over the feature dimension) 标 了 一 条 波浪 线 ， 特 
征 和 矩阵 的 元 素 标 了 一 项 帽子 (如 多 ,> ) 。 

Symeonidis 等 [35] 提 出 使 用 0/1 的 解释 方案 ( 见 图 19. 1 左 部 ) 通 过 高 阶 SVDCHOS- 
VD) XARA; 高 阶 SVD 是 张 量 SVD 的 多 维 模拟 ， 近 期 综述 参见 文献 [18]。 基 本 的 想法 
是 通过 优化 平方 损失 来 最 小 化 4 各 个 元 素 上 的 损失 ， 即 

argmin A (Garter re) 


Cu. t. CUXTXR 


Rendle 等 [26] 从 另 一 个 角度 提出 RTF T 
(利用 张 量 分 解 进行 排序 )， 这 种 方法 学 习 出 4 p e NEP 


的 最 优 分 解 来 解决 标签 推荐 这 个 特定 问题 。 E 
首先 ， 将 观察 到 的 标签 赋值 分 为 积极 的 、 消 R 


极 的 和 缺失 的 ， 具 体 描 述 参见 19.2.1 B CIL 


图 19. 1 ER). $ Py: ={(u, 7)| 3tET: " 
(uy t, NEYE Y 中 所 有 不 同 的 “用 户 / 资 图 19.8 张 量 分 解 


源 ” 组 合 的 集合 ， 一 个 特定 的 (U，R)E PAW 
积极 标签 和 消极 标签 的 集合 定义 为 
Tt: = (t | Gu € B, A Caster) € Y} 
T; : = (t | Gar) € P, A Go trn) € Y) 
由 此 ， 标 签 成 对 排序 (pairwise tag ranking) 的 约束 条 件 可 以 定义 为 
uar > Busty Qs tir) € Tir A Got € T», (19. 12) 
于 是 ， 代 替 基 于 HOSVD 的 方法 中 最 小 化 最 小 二 乘 误差 ， 提 出 了 另 一 个 优化 准则 : 最 
大 化 排序 统计 量 AUCCROC pileos 特定 (x，r)E Pak) AUC 度量 ， 定 义 为 
AUC(ĝ usr): = S M Bose — Âu.) (19. 13) 


A oa 
€T, €T,, 


COPS, T To ls 
RB, H.E Heaviside MA: 
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0,r«0 
H,:—4a,r—0 (19. 14) 
1,r 20 
关于 排序 统计 量 AUC 和 所 观察 到 的 数据 的 整体 优化 任务 可 以 表示 为 
argmax 2 AUC(Ó,u,r) (19. 15) 


6 DEPA 


该 优化 问题 于 是 可 以 通过 梯度 下 降 法 [26] 来 求解 。 注意 ， 既 然 最 大 化 仅 通 过 所 观察 到 
的 标签 赋值 来 实现 ， 用 这 个 优化 标准 时 缺失 值 也 被 考虑 在 内 。 

多 模式 推荐 (Multi-mode Recommendation) “一旦 4 计算 出 来 了 ， 一 个 给 定 的 用 户 zx 
和 一 个 给 定 的 资源 ~ 的 n 个 最 高 分 标签 的 列表 可 以 这 样 计算 : 


Top(u,r,n): = argmax d, (19. 16) 
t€ 


给 定 标签 上: 和 用 户 u 去 推荐 ”个 资源 ， 可 以 用 以 上 类 似 的 方式 ( 见 文献 L36])。 这 样 
看 ， 张 量 建 模 能 够 以 简单 的 方式 支持 进行 多 模式 推荐 。 然 而 ， 以 上 所 述 的 RTF 方法 中 ， 
矩阵 分 解 被 用 来 解决 一 个 特定 的 标签 排序 优化 问题 ， 可 能 有 必要 为 每 个 兴趣 模式 定义 特定 
的 优化 函数 。 

关于 复杂 度 ARIF 或 HOSVD 这 类 分 解 模型 的 一 个 主要 的 好 处 是 ， 模 型 构建 后 ， 
预测 只 依赖 于 较 小 的 分 解 维度 。HOSVD 可 以 用 Sun 和 KoldaL19] 的 方法 有 效 执行 。 还 有 
一 些 方法 通过 切片 L38] 或 近似 [4] 来 改善 大 型 数据 集 的 可 扩展 性 。 
19.4.2.2 FolkRank 


网 络 搜索 算法 PageRank[L2j] 反 映 出 这 样 的 思想 : 如 果 一 个 网 页 有 很 多 网 页 可 以 链接 到 
它 ， 且 那些 页 面 本 身 是 重要 的 ， 那 么 这 个 网 页 是 重要 的 ? 。 在 文献 [12] 中 ，hotho 等 采用 
相同 的 基本 原则 进行 类 似 Google 的 大 众 分 类 的 搜索 和 排序 。FolkRank 算法 的 核心 思想 
是 ， 一 个 被 重要 用 户 打上 重要 标签 的 资源 本 身 就 变 得 重要 起 来 。 同 理 ， 这 对 标签 和 用 户 也 
适用 。 于 是 ， 我 们 构建 一 个 图 ， 图 的 顶点 在 互相 传播 它们 的 权重 中 加 强 彼此 。 在 本 节 中 ， 
我 们 简要 地 回顾 FolkRank 算法 的 原理 ， 并 解释 它 如 何 用 于 生成 标签 推荐 。 l 

由 于 大 众 分 类 与 Web 图 的 性 质 不同 ( 无 向 三 元 超 边 ， 而 不 是 定向 二 元 边 ) PageRank 
不 能 直接 应 用 于 大 众 分 类 。 为 了 在 大 众 分 类 上 运用 权重 传播 方案 ， 我 们 分 两 步 来 解决 这 个 
问题 。 首 先 ， 我 们 将 超 图 转换 成 一 个 无 向 图 。 然 后 ， 我 们 采用 一 种 差分 排序 的 方法 ， 来 应 
对 网 络 的 扭曲 结构 和 大 众 分 类 的 无 向 性 ， 并 支持 特定 主题 排序 (topic-specific rankings) 。 

PageRank -适应 大 众 分 类 ”首先 ， 我们 将 大 众 分 类 FF=(U，T，R, Y) 转 化 成 一 个 无 
向 三 分 图 Gr 一 (V，E)。 图 的 节点 集 V 由 标签 、 用 户 和 资源 的 不 相交 集合 组 成 (如 ,，V=U 


UTUR)。 所 有 标签 和 用 户 、 用 户 和 资源 、 标 签 和 资源 的 共 现 都 成 为 各 自 节点 之 间 的 边 ; 
BD Y 中 的 每 个 三 元 组 (U，T，R) 产 生出 玉 中 的 三 条 无 向 边 {U, T). (U, R}, (T, R}. 
AUF PageRank， 我 们 采用 随机 冲浪 模型 ， 这 个 模型 基于 这 样 的 想法 : 一 个 理想 化 
的 随机 网 页 访问 路 径 沿 着 链接 进行 游 走 (比如 ， 从 资源 页 面 标签 跳 转 到 标签 页 面 或 者 用 户 
页 面 ),， 但 偶尔 会 不 沿 着 链接 (随机 ) 跳 路 到 一 个 新 的 网 页 上 。 这 引出 下 面 的 定义 。 
图 中 顶点 的 排序 ( 像 在 PageRank 中 那样 ) 通 过 “权重 扩散 ”来 计算 : 
W+ *-dATw, + (1— d)p (19. 17) 
其 中 ，w 是 权重 向 量 ，V 中 的 每 个 节点 对 应 向 量 中 一 个 元 素 ; A 是 上 边 定 义 的 图 Gs 


O 这 个 想法 以 相似 的 方式 在 HITS[17] 中 拓展 到 网 络 双向 子 图 和 [42] 中 的 n 元 有 向 图 。 
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的 邻接 矩阵 2 的 行 随机 版 本 ， p 是 一 个 随机 冲浪 矢量 ， 在 我 们 的 设 定 中 用 作 偏 好 向 量 ; de 
[0，1] 用 于 决定 p 的 影响 强度 。 归 一 化 向 量 p ESR ES lw l= 上 p 1!。 这 确保 
了 系统 中 的 权重 将 保持 不 变 。 每 个 节点 的 排序 分 值 是 其 在 迭代 过 程 中 的 极限 w: =limw,. 

对 于 全 局 排序 ， 有 人 会 选择 p=1, PHL 组 成 的 向 量 。 然 而 ,为 了 生成 推荐 ,可 以 
调整 p， 对 当前 要 生成 推荐 的 那个 用 户 节点 和 资源 节点 给 予 更 高 的 权重 。 然 后 ， 推 荐 结果 
个 (u，7) 就 是 排 在 前 n 个 “标签 节点 ”组 成 的 集合 。 

由 于 图 Ge 是 无 向 的 ，t 时 刻 经 过 某 条 边 的 权重 大 部 分 会 在 i 十 1 时 刻 回流 。 于 是 ， 计 算 
结果 与 完全 基于 度数 的 排序 颇 为 相似 (但 由 于 随机 冲浪 ， 并 不 完全 相同 )。 在 后 面 的 实验 
中 ， 我 们 将 看 到 这 个 算法 版 本 表现 得 合理 ， 但 不 出 色 。 这 符合 文献 [12] 中 的 观察 ， 该 文 表 
明 特 定 主题 的 排序 (topic-specific rankings) 会 因 全 局 图 的 结构 而 产生 人 和 偏差。 因此， 我 们 在 
文献 L12] 研 发 了 下 面 这 个 差分 方法 。 

FolkRank- 特 定 主题 排序 ”不管 使 用 什么 偏好 向 量 ， 图 Cr 的 无 向 性 使 得 它 很 难 使 高 边 
度 节点 以 外 的 其 他 节点 获得 高 排名 。FolkRank 的 差分 方法 解决 了 这 个 问题 ， 它 给 folkson- 
omy 中 的 元 素 计 算 一 个 特定 主题 的 排序 。 就 我 们 的 情况 而 言 ， 主 题 是 由 我 们 打算 做 标签 推 
荐 的 用 户 / 资 源 对 (u，7) 决 定 的 。 

1. Sw? HRAN IDE p—1 时 的 不 动 点 。 

2. $ w? HRAN IDE p=1 fB pLuj==1 十 |U| 且 pLrj==1 十 |RI 时 的 不 动 点 。 

3.w :三 w ”一 w'"” 即 最 终 的 权重 向 量 。 

于 是 ， 与 没有 偏好 向 量 的 基准 方法 相 比 ， 我 们 计算 出 给 定 一 个 用 户 /资源 对 时 ， 节 点 
间 的 相互 加 强 后 的 赢家 和 输家 。 我 们 称 大 众 分 类 的 元 素 z 的 最 终 权 重 w[Lzxj 为 x 的 
FolkRank, 9 : 

多 模式 推荐 (Multi-mode Recommendation) “对 一 个 给 定 的 用 户 / 资 源 对 (x，zr) 生 成 标 
签 推荐 ， 如 前 所 述 计算 排序 ， 然 后 限制 结果 集 个 (wx，r) 到 前 ”个 标签 节点 。 同 样 ， 你 可 以 
通过 给 某 个 用 户 ( 或 资源 ) 优 先 权 ， 给 用 户 ( 或 资源 ) 计 算 推 荐 结果 。 由 于 FolkRank 在 大 众 
分 类 所 有 三 个 维度 上 计算 排序 ， 这 将 产生 对 给 定 用 户 ( 或 资源 ) 最 相关 的 标签 、 用 户 和 
资源 。 

关于 复杂 度 ”改进 的 PageRank 的 一 轮 迭 代 需 要 dAw 十 (d 一 1)p 次 计算 ， 其中, AE 
R”, s: - [U| - | T| +R]. 假设 :表示 和 迭 代 次 数 ， 复 杂 度 为 (5 十 s)+€E Ol(s*t)。 然 而 ， 
由 于 A 是 稀疏 的 ， 更 有 效 的 做 法 是 线性 地 遍历 Y 中 的 所 有 标签 赋值 来 计算 乘积 Aw。 计 算 
排序 后 ， 我 们 需要 将 标签 的 权重 排序 ， 以 收集 前 ”个 标签 。 


19.4.3 基于 内 容 的 社会 化 标签 推荐 系统 


目前 为 止 ， 讲 到 的 所 有 算法 都 不 利用 资源 的 内 容 ， 因 此 可 以 应 用 到 任何 大 众 分 类 ， 无 
须 考 虑 支持 的 资源 的 类 型 。 尽 管 如 此 ， 资 源 的 内 容 是 一 种 有 价值 的 信息 来 源 ;， 特别 是 在 冷 
启动 的 情况 下 ， 用 户 显 式 反馈 稀缺 。 下 面 简短 地 讨论 显 式 使 用 资源 内 容 的 推荐 系统 。 


O 如 果 ( PEE, Max iouis: 否则 为 0。 

也 包括 没有 排序 降级 的 情况 ， 在 无 向 图 Gr 中 都 保持 为 零 。 

文献 [12] 表 明 ，w 在 真实 世界 的 一 个 大 规模 数据 集 上 产生 了 真正 有 价值 的 结果 ， 而 W' 产 生 了 与 主题 相关 的 元 
素 和 高 边 度 元 素 的 非 结构 化 混合 。 在 文献 [13] 中 ， 我 们 采用 这 种 方法 用 于 检测 大 众 分 类 随时 间 推移 的 趋势 。 
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19. 4. 3. 1 基于 文本 

Song 等 [32] 提 出 了 一 种 基于 图 聚 类 的 方法 来 给 文本 资源 打 标 签 ， 如 网 页 或 其 他 类 
型 的 文档 。 它 不 做 个 性 化 推荐 ， 因 为 它 不 单独 考察 各 个 用 户 。 特 别 是 ， 它 考虑 资源 中 包 
含 的 文档 、 标 签 、 词 语 之 间 的 关系 。 这 些 关系 用 两 个 二 分 图 表示 。 该 方法 分 作 两 个 
阶段 : 

。 在 离线 阶段 ， 它 有 效 地 对 两 个 二 分 图 的 加 权 邻 接 矩 阵 进行 低 秩 逼 近 ， 采 用 Lanczos 

算法 [8] 将 图 对 称 分 割 为 多 类 簇 。 此 外 ， 它 还 提出 了 一 种 新 的 节点 排序 方案 ， 对 簇 
内 标签 对 应 的 节点 进行 排序 。 其 次 ， 它 采用 一 个 泊 松 混合 模型 来 给 每 个 类 别 学 习 
文档 分 布 。 

。 在 在 线 阶段 ， 给 定 一 个 文档 向 量 ， 基 于 标签 和 文档 的 联合 概率 ， 根 据 它们 (标签 ) 

的 簇 内 排序 给 这 个 文档 推荐 标签 。 

如 文献 [32] 中 所 解释 的 ， 这 个 双 阶 段 框架 可 以 被 解释 为 一 种 “无 监督 一 有 监督 ”学 习 过 
程 。 在 离线 阶段 ， 节 点 被 分 割 成 马 ( 无 监督 学 习 ) 和 簇 标签 被 分 配给 文档 节点 ， 作 为 “类 ”的 
标签 。 此 外 ， 标 签 节 点 在 各 个 簇 内 被 赋 上 排序 。 然 后 ， 基 于 文件 和 词语 节点 的 分 布 建立 起 
了 一 个 混合 模型 。 在 线 阶 段 ， 一 个 文档 被 分 类 (有 监督 学 习 ) 到 预定 义 的 簇 上 (这 些 簇 是 在 
第 一 阶段 利用 朴素 贝 叶 斯 得 到 的 )， 使 得 标签 按 它们 的 排序 从 高 到 低 进 行 推荐 。 

Song 等 [32] 强 调 方 法 的 效率 ， 泊 松 混 合 模 型 可 以 保证 这 一 点 ， 它 让 推荐 在 线性 时 间 
内 完成 。 从 CiteULike(9623 篇 论文 和 6527 个 标签 ) 和 Delicious(22 656 的 URL 和 28 457 
标签 ) 爬 取 的 两 个 大 数据 集 上 的 实验 结果 显示 ， 推 荐 可 以 在 一 秒 钟 内 给 出 。 

最 近 Illig 等 [14] 也 研究 了 “给 定 一 个 资源 ， 基 于 内 容 来 推荐 标签 ”的 不 同方 法 。 
19. 4. 3.2 基于 图 像 


Abbasi 等 [1] 提 出 使 用 标签 作为 高 层次 特征 ， 同 低层 次 的 图 像 特征 一 起 在 Flickr 上 训 
练 图 像 分 类 器 。 尽 管 这 种 方法 并 不 直接 适用 于 推荐 系统 ， 它 提供 了 一 些 关 于 “如 何 结合 标 
签 和 低层 次 图 像 特征 ”的 有 趣 见 解 ， 这 可 以 最 终 作 为 一 个 推荐 的 输入 。 想 法 是 ， 先 从 图 像 
的 标签 信息 创建 一 个 向 量 空 间 ， 然 后 使 用 小 波 变换 创建 一 个 低层 次 的 图 像 特征 空间 。 接 着 
合并 这 两 个 特征 空间 ， 并 用 来 在 组 合 的 特征 空间 中 训练 一 个 单 类 支持 向 量 机 (SVM) 分 
类 器 。 

为 了 创建 一 个 基于 标签 的 图 像 特征 向 量 ， 用 “ 词 袋 ”"(bag-of-words) 模 型 来 将 标签 表示 
成 特征 。 然 后 ， 对 特征 向 量 按 词 频 (Term Frequency，TF) 做 归 一 化 。 注 意 ， 如 果 所 属 图 
像 有 很 多 标签 ， 那 么 标签 的 权重 会 较 低 。 接 着 ， 标 签 特征 向 量 可 以 表示 为 

fioi (tf (ti or) tf (ter) yee tf gms 

其 中 ，tf(t，7) 表 示 与 资源 r+ 共 现 的 标签 上 的 归 一 化 词 频 。 

RGB 颜色 用 于 低层 次 特征 提取 。 每 个 图 像 > 被 表示 为 一 个 四 维 向 量 

Je $= Core sta usar tul 

其 中 ， 第 一 个 成 分 cu" 是 图 像 ~ 的 像素 值 均值 ， 其 余 成 分 分 别 代表 红色 、 绿 色 和 蓝 色 通道 
的 像素 值 均值 。 

然后 ， 特 征 向 量 结合 起 来 ， 即 

Ser 10 Gf Oy or) tf Cte or) tf prm 91) 01, 9 Carr Ca o5 C4.) T 

这 种 组 合 的 特征 向 量 接着 用 来 作为 单 类 SVM 分 类 器 的 输入 。 从 Flickr 收集 的 真实 数 

据 上 的 实验 表明 ， 使 用 组 合 特征 向 量 训 练 的 分 类 器 的 性 能 大 大 优 于 只 用 标签 特征 向 量 或 低 


第 19 章 ”社会 化 标签 推荐 系统 —423 


层次 图 像 特征 向 量 单独 训练 的 分 类 器 。 
19.4.3.3 ”基于 音频 


Eck 等 L5] 提 出 了 一 种 直接 从 MP3 文件 预测 社会 化 标签 的 方法 。 这 些 标签 被 称 为 自动 
标签 (automatic tags， 简 称 autotags) ， 因 为 它们 直接 产生 于 音乐 内 容 。 当 一 个 集合 中 存在 
未 贴标签 或 者 标签 低劣 的 几 首 歌曲 ，autotags 就 能 起 到 作用 。 因 此 ，autotags 在 音乐 推荐 
系统 中 帮助 解决 “ 冷 启 动 问 题 "?。 尽 管 如 此 ，autotags 通过 给 音乐 推荐 系统 的 所 有 曲目 提供 
一 组 具有 可 比 性 的 基准 标签 来 平滑 标签 空间 。 

Autotags 通过 一 个 机 器 学 习 模 型 生成 ， 使 用 元 学 习 算法 AdaBoost 从 音频 特征 中 预测 
标签 ， 例 如 ， 梅 尔 频 率 倒 谱系 数 (MFCC) 特 征 ， 为 歌曲 中 选 定 标签 计算 的 自 相 关系 数 ， 通 
过 常量 Q 频率 (constant-Q frequency) 采 样 的 频谱 系数 。 音 频 特征 在 歌曲 内 的 短 滑 动 窗口 
上 计算 ， 产 生 了 数量 巨大 的 特征 。 为 了 减少 这 个 数量 ， 通 过 在 短 窗户 (如 5 秒 ) 特 征 数据 上 
计算 之 前 音频 特征 单独 的 均值 和 标准 差 ( 即 独立 高 斯 )， 创 建 出 “聚合 ”特征 。 

特征 选择 按 如 下 方式 进行 。 模 型 基于 “各 个 特征 最 小 化 经 验 误 差 的 能 力 ? 来 选择 特征 。 
因此 ， 与 之 关联 的 弱 学 习 器 (leanrner) 被 AdaBoost 选中 太 晚 ， 这 样 的 特征 就 被 丢弃 掉 。 

由 于 标签 频率 的 高 度 偏 斜 分 布 (high skewness)， 预 测 任务 被 视 为 一 个 分 类 问题 。 对 于 
每 一 个 标签 ， 预 测 一 个 特定 的 歌手 “无 ”(none)、“ 有 一 些 ”(some) 或 “有 很 多 ”(a lot) 某 个 特 
定 的 标签 ( 相 比 其 他 标签 ) 。3 个 类 别 ( 即 “无 ”有 有 一些”“ 有 很 多 ”) 之 间 的 边界 的 量化 过 程 : 
将 所 有 歌手 归 一 化 的 标签 数目 求 和 ， 为 每 个 标签 产生 一 个 100 组 距 的 直方 图 ， 移动 类 别 边 
界 使 得 相等 数目 的 歌手 分 到 每 个 类 别 中 。 

要 生成 自动 标签 ， 这 些 类 别 需 要 转化 成 “ 词 袋 ”来 与 歌手 关联 上 。 基 于 3 个 类 别 的 语 
义 ， 从 “a lot” 组 距 中 减 去 “none” 组 距 的 值 ， 因 为 “none” 与 “a lot” AR A (AL, “some” 
类 只 是 为 了 使 分 类 器 在 预测 “none” 和 “a lot” 时 更 具有 选择 性 )。 

在 1277 位 艺术 家 的 89 924 首 歌曲 上 进行 了 自动 标签 生成 的 实验 评估 ， 产 生出 超过 
100 万 个 5 秒 聚 合 特征 。 重 点 关注 在 线 社 交 电 台 Last. fm 上 的 60 个 最 热门 标签 。 这 些 标签 
包括 如 “Rock” 这 样 的 流派 和 像 “chillout” 这 种 与 情绪 有 关 的 标签 。 分 类 错误 显著 低 于 随机 
误差 。 正 如 文献 L[5] 所 述 ， 性 能 应 该 与 其 他 分 类 器 (如 SVM 和 神经 网 络 ) 做 对 比 来 更 好 地 评 
估 该 方法 的 优点 。 


19. 4.4 评估 方案 和 评估 度量 


下 面 给 出 了 一 些 用 于 评价 不 同 的 推荐 模式 的 评估 方案 与 度量 。 想 要 更 全 面 地 了 解 推荐 
系统 的 评估 方案 ， 请 参阅 第 8 章 。 
资源 推荐 ”为 了 评估 标签 感知 (tag-aware) 的 资源 推荐 ， 用 于 传统 的 推荐 系统 的 常见 方 
案 和 度量 ， 可 以 直接 使 用 [9]( 参 见 第 8 章 )。 
标签 推荐 ”对 于 评估 标签 推荐 ， 有 两 种 可 能 的 场景 ， 这 最 终 会 导致 两 种 不 同 的 评估 方案 : 
。“ 新 发 布 "*， 用 户 选 择 了 一 个 他 尚未 标记 的 资源 ， 系 统 尝 试 为 这 个 资源 向 用 户 推 荐 
一 个 包含 n 个 标签 的 个 性 化 列表 。 该 方案 最 初 在 [24，16] 中 使 用 ， 称 为 弃 一 
(LeaveOnePostOut) 方 案 。 对 每 一 个 用 户 w， 随 机 选择 他 的 一 个 资源 ， 删 除 该 资源 
的 所 有 标签 ， 从 而 生成 一 个 单独 的 训练 集 。 于 是 ， 训 练 集 是 folksonomy(U, T, 
R: YO. Y. =Y \ ({u} X tags (u, ru) X {ru))， 其 中 ，tags(u，ru) 是 一 组 如 用 
È uA ru 打 的 标签 。 该 任务 随后 就 产生 与 tags(u，ru) 相 近 的 预测 。 这 就 再 现 了 
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这 样 的 场景 : 一 个 用 户 有 一 个 未 标记 的 资源 ， 系 统 尝试 给 出 有 用 的 推荐 。 
© “PRE”: 用 户 选 择 一 个 他 已 经 标记 过 的 资源 ， 系 统 提 出 了 个 额外 标签 的 个 
性 化 列表 ， 用 户 可 能 想 要 用 来 改善 他 对 资源 的 标记 。[35j 首 次 引入 这 个 方案 。 想 法 
是 将 标签 赋值 拆 分 成 过 去 的 标签 赋值 (训练 集 ) 和 未 来 的 标签 赋值 (测试 集 )。 这 反映 
了 这 样 的 场景 : 用 户 在 逐步 给 物品 打 标 签 ， 在 他 们 提供 所 有 标签 之 前 接收 到 推荐 。 
对 于 这 两 个 方案 ， 常 见 的 准确 率 、 召 回 率 和 用- 测度 经 常 被 使 用 [15，35，11，26]: 
|tags(usr,) N 个 (ur,) | 


Recall(T(usr,)) = (19. 18) 
| tags(uyr,) | 
Precision ta n))  TageGeno 1 Pam | (19. 19) 
I TG r2] 
Fiat = 2 ¢ RecallCT (Gu, r,)) * Precision(T(u,r,)) (19. 20) 


Recall(T(u,r,)) + Precision( T(u,r,)) 

此 外 ， 这 两 种 场景 下 可 以 应 用 于 一 个 在 线 环境 ， 推 荐 被 实时 计算 并 在 用 户 对 资源 做 标 
注 过 程 展现 给 用 户 。e 如 果 用 户 点 击 了 一 个 推荐 的 标签 或 者 使 用 了 推荐 (例如 ， 自 动 补 全 机 
制 )， 可 以 记录 下 来 。 此 设置 可 能 是 最 现实 的 一 个 ， 并 为 “用 户 有 多 喜欢 推荐 ”提供 了 一 个 
很 好 的 度量 。 然 而 ， 建 立 起 来 相当 费力 ， 而 且 需 要 一 个 有 活跃 用 户 的 系统 。 也 有 一 些 用 户 
不 点 击 推荐 或 使 用 自动 补 全 ， 这 会 影响 评价 。 

用 户 推 荐 ”对 于 用 户 推 荐 的 任务 ， 系 统 给 目标 用 户 建议 一 个 n 个 用 户 的 个 性 化 列表 ， 
这 些 用 户 形成 他 的 近邻 。 有 些 系统 ， 像 Last. tm， 提供 用 户 与 用 户 之 间 的 连接 信息 (在 
Last. fm， 社 交 关 系 连 接 在 一 起 的 用 户 称 为 邻居 ) 。 如 果 这 些 信 息 可 用 ， 那 么 它 可 以 作为 用 
户 推荐 评估 的 客观 标准 。 在 一 些 情况 下 ， 这 样 的 客观 标准 不 可 用 ( 像 在 Bibsonomy)， 用 户 
推荐 评估 可 以 沿 着 评估 用 户 群 体 这 个 思路 来 进行 ;最 值得 一 提 的 是 ， 像 [22] 中 所 描述 的 那 
样 计算 群体 内 物品 之 间 的 相似 度 。 特 别 是 在 一 个 社交 化 书签 系统 (如 BibSonomy), ， 对 于 每 
个 网 络 资源 ， 它 的 第 一 个 页 面 (首页 ) 可 以 抓 取 和 预 处 理 ， 创 建 出 一 个 词 向 量 。 通 过 这 种 方 
式 ， 任 何 两 个 Web 资源 之 间 的 余弦 相似 性 可 以 计算 如 下 。 对 于 每 个 测试 用 户 的 近邻 ( 即 最 
相似 的 用 户 )， 可 以 计算 出 近邻 内 的 所 有 Web 资源 对 的 平均 余弦 相似 度 (ACS) ACS 对 应 
近邻 内 相似 度 。 此 外 ， 所 有 测试 用 户 的 近邻 中 随机 选择 一 定数 目的 近邻 对 ， 可 以 计算 出 所 
有 近邻 对 之 间 的 平均 Web 资源 的 相似 性 。 这 个 度量 对 应 近邻 间 的 相似 性 。 因 此 ， 推 荐 的 
用 户 近 邻 的 质量 依据 其 近邻 内 相似 度 ( 越 高 越 好 ) 和 近邻 间 的 相似 性 ( 越 低 越 好 ) 来 判断 。 


19.5 算法 比较 


在 本 节 中 ， 我 们 简要 地 讨论 在 19.4 节 中 介绍 的 算法 的 主要 优点 和 缺点 。 请 注意 ， 我 
们 只 考虑 非 基 于 内 容 的 算法 ， 因 为 它们 可 以 在 一 个 共同 的 基础 做 对 比 。 

在 19.4. 1 节 中 ， 我 们 看 到 为 了 将 基于 协同 过 滤 的 标准 算法 应 用 于 大 众 分 类 ， 必 须 进 
行 一 些 数据 转换 。 这 样 的 转换 导致 信息 丢失 ， 它 会 降低 推荐 质量 。 基 于 协同 过 滤 的 方法 存 
在 另 一 个 众所周知 的 问题 ， 大 型 投影 矩阵 必须 保存 在 内 存 中 ， 它 带 来 时 间 / 空 间 消 耗 ， 从 
而 影响 进行 实时 推荐 的 能 力 。 另 一 个 问题 是 ， 对 每 种 不 同 的 推荐 模式 ， 算 法 必须 最 终 改 
变 ， 要 求 额外 的 工作 来 提供 多 模式 推荐 。 

FolkRank 建立 在 PageRank 的 基础 上 ， 并 被 证 实 给 出 比 CF 明显 好 的 标签 推荐 [15]。 


日 ”这 是 一 个 2009 年 ECML PKDD 发 现 挑战 赛 的 任务 ， 见 http://www. kde. cs. uni-kassel. de/ws/dc09/, 
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这 种 方法 也 允许 模式 切换 时 算法 不 做 变化 。 此 外 ， 同 基于 协同 过 滤 的 算法 一 样 ，FolkRank 
具有 对 在 线 更 新 的 健壮 性 ， 因 为 在 一 个 新 的 用 户 、 资 源 或 者 标签 进入 系统 时 ， 它 不 需要 每 
次 都 重新 训练 。 然 而 ，FolkRank 计算 昂贵 且 扩 展 不 便 ， 更 适用 于 实时 推荐 非 必需 的 系统 。 

5j FolkRank 一 样 ， 张 量 分 解 方法 直接 用 于 大 众 分 类 的 三 元 关系 。 虽 然 在 学 习 阶 段 会 
有 较 大 消耗 (计算 量 大 )， 它 可 以 离线 执行 。 完 成 模型 学 习 后 ， 可 以 快速 作 推荐 ， 使 这 些 算 
法 适用 于 实时 推荐 。 张 量 分 解 方法 的 一 个 潜在 缺点 是 ， 仅 当 不 同 的 推荐 问题 ( 即 用 户 / 资 
源 /标签 ) 可 以 通过 最 小 化 同样 的 错误 函数 来 解决 时 ， 才 能 实现 简单 的 模式 切换 。 如 果 选 择 
HOSVD， 例 如 ， 该 模型 可 以 通过 简单 的 模式 切换 来 进行 多 模式 推荐 ， 但 代价 是 解决 错误 
的 问题 : HOSVD 最 小 化 均 方 误差 函数 ， 而 社交 标签 推荐 系统 与 排序 更 相关 。 如 果 你 试图 
面向 一 个 特定 推荐 模式 的 错误 函数 来 完美 地 重建 张 量 ， 那 么 ， 该 特定 模式 的 准确 度 最 终 会 
提高 ， 但 代价 是 模式 切换 更 复杂 。 针 对 标签 推荐 问题 ， 图 19. 9 显示 在 BibSonomy 数据 集 
的 一 个 快照 上 对 上 述 算法 进行 了 比较 [26]。 需 要 注意 的 是 ， 最 好 的 方法 是 RTF， 接 着 是 
FolkRank 和 HOSVD。 


BibSonomy 


x 
+ 
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F-Measure 





Topn 
图 19.9 BibSonomy 数据 集 截 图 上 Topl, Top2 到 ToplO 的 F- 算 分 值 。 对 比 了 FolkRank, PageRank, 
HOSVD 和 弃 一 法 下 增加 维度 数 的 RTF 
表 19. 2 总 结 了 这 次 讨论 。 注 意 ， 表 19. 2 中 没有 标 “X” 表 示 所 考虑 的 算法 不 能 轻易 获 


得 相应 的 特性 。 : 
R192 目前 算法 的 优 缺 点 总 结 


pane |  WSIAXK 










NLIS DOGMA RE ANE! 





426 FORD 推荐 系统 与 群体 





19.6 总 结 与 展望 


Web 2.0 代表 了 从 Web 作为 信息 源 到 Web 作为 参与 平台 的 转变 ， 用 户 可 以 上 传 内 
容 ， 行 使 对 这 些 内 容 的 控制 权 ， 在 他 们 使 用 中 增加 了 应 用 的 价值 。Web 2.0 应 用 中 最 突出 
的 是 社会 标签 系统 ， 通 过 将 用 户 的 标签 /资源 暴露 给 其 他 用 户 ， 促 进 了 标签 /资源 的 共享 。 
由 于 这 些 系 统 日 益 普及 ， 信 息 过 载 等 问题 迅速 成 为 难题 。 推 荐 系统 过 去 被 证 明 非 常 适合 这 
类 难题 ， 因 而 是 解决 下 一 代 Web 信息 过 载 的 一 个 突出 手段 。 在 本 章 中 ， 我 们 提出 : 

。 大 众 分 类 的 数据 结构 ， 强 调 与 传统 推荐 系统 所 使 用 的 数据 结构 的 差异 。 

。 可 用 于 社会 标签 系统 中 推荐 的 不 同 模式 。 

。 部 署 在 真实 社会 标签 系统 上 的 推荐 系统 ， 强 调 这 样 做 的 挑战 和 要 求 。 

。 获取 标签 的 不 同方 式 ， 以 及 它们 如 何 影响 推荐 算法 。 

。 算法 : 

m 降低 数据 维 数 的 算法 ， 以 应 用 标准 的 协同 过 滤 算 法 。 
E 在 大 众 分 类 三 元 关系 数据 上 直接 操作 的 算法 。 
m 利用 内 容 资 源 的 算法 。 

。 评估 方案 和 度量 。 

。 各 个 算法 的 利弊 比较 。 

变换 原 有 大 众 分 类 数据 的 方法 虽然 可 以 直接 应 用 于 基于 标准 协同 过 滤 的 算法 ， 但 是 变 
换 不 可 避免 地 导致 一 些 信息 丢失 ， 这 会 降低 整体 的 推荐 质量 。 某 些 方 法 试图 通过 对 变换 产 
生 的 不 同 数据 映射 进行 某 种 组 合 来 克服 这 个 问题 ， 这 增加 了 额外 的 自由 参数 用 以 控制 每 个 
组 成 部 分 的 影响 。 一 个 更 自然 的 解决 方案 是 直接 作用 于 大 众 分 类 原 有 的 三 元 关系 上 ， 这 就 
要 求 研发 出 新 的 推荐 系统 算法 如 FolkRank( 探 究 folksonomy 的 超 图 ?或 基于 张 量 分 解 的 算 
法 。 虽 然 FolkRank 以 其 高 品质 的 预测 著称 ， 但 也 会 遇 到 可 扩展 性 问题 ， 所 以 一 个 有 趣 的 
”研究 方向 是 探讨 如 何 使 其 具有 可 扩展 性 。 

用 于 社会 标签 推荐 系统 的 张 量 分 解 是 一 个 最 近 突 出 的 研究 领域 。 关 于 这 一 主题 的 研究 
工作 才刚 刚 开始 发 现 那 些 方法 应 当 有 的 优势 。 一 个 特别 有 吸引 力 的 研究 方向 是 具有 高 推荐 
精确 和 模式 易 切 换 两 个 特性 的 张 量 分 解 模型 。 

正如 之 前 指出 的 ， 大 众 分 类 通常 不 包含 数值 型 评分 ,但 最 近 GroupLens9 研 究 小 组 发 
布 了 大 众 分 类 的 数据 集 ， 其 中 也 提供 了 标签 资源 的 数值 型 评分 。 这 表示 有 一 些 研究 机 会 : 
如 何 利用 资源 的 评分 信息 来 改善 推荐 。 在 这 种 情况 下 ， 所 有 模式 采用 一 个 单一 的 数据 结构 
(如 张 量 或 超 图 ) 最 终 会 失败 ， 因 为 评分 仅 与 “用 户 一 资源 ”对 有 关 ， 而 与 标签 无 关 。 对 基于 
内 容 的 方法 ， 也 有 类 似 的 问题 。 我 们 看 到 ， 基 于 内 容 的 方法 通常 忽略 用 户 信 息 ， 但 以 往 的 
研究 表明 ， 结 合用 户 的 喜好 与 资源 的 内 容 的 混合 方法 通常 会 带 来 更 好 的 推荐 系统 。 在 这 
里 ， 张 量 或 超 图 表示 将 会 再 次 失败 ， 因 为 资源 的 内 容 只 涉及 资源 ， 而 不 涉及 用 户 或 标签 。 
因此 ， 将 大 众 分 类 的 表示 方法 和 资源 的 内 容 做 某 种 形式 融合 的 混合 方法 (hybrid-based 
methods) 将 对 该 领域 产生 有 价值 的 贡献 。 

本 章 未 包括 一 些 其 他 有 趣 的 研究 方向 ， 比 如 ， 推 荐 的 新 颖 性 和 惊喜 度 [44]， 即 潜在 有 
趣 但 并 不 明显 的 标签 、 用 户 和 (或 ?资源 ;用 于 推荐 的 社会 智慧 建 模 [40，29]， 即 显 式 的 好 


Q http://www. grouplens. org/ 
© 可 以 从 http://www. grouplens. org/node/73/ 下 载 数据 集 。 


第 19 章 社会 化 标签 推荐 系统 4127 





友 关 系 的 强度 和 用 户 之 间 的 互信 关系 (可 能 与 兴趣 、 行 为 的 相似 度 正 交 )， 可 以 建 模 并 用 于 
提升 推荐 系统 的 质量 。 
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Recommender Systems Handbook 


信任 和 推荐 





Patricia Victor, Martine De Cock 和 Chris Cornelis 


摘要 ”推荐 技术 和 信任 度 是 信任 增强 推荐 系统 的 两 大 支柱 。 本 章 首先 讨论 信任 的 一 些 
基本 概念 ， 如 信任 和 不 信任 模型 、 传 播 和 聚合 等 。 这 些 概 念 对 于 理解 信任 增强 推荐 系统 技 
术 背 后 的 原理 是 非常 必要 的 。 我 们 讨论 这 些 技术 并 且 主 要 集中 在 信任 度 和 算 子 在 推荐 系统 
中 的 应 用 上 。 其 次 ， 我 们 阐述 了 推荐 算法 中 使 用 信任 度 的 好 处 ， 总 结 了 信任 增强 推荐 系统 
中 的 最 新 方法 。 此 外 ， 我 们 详细 介绍 了 三 个 知名 的 信任 增强 推荐 系统 ， 并 对 它们 的 性 能 进 
行 了 分 析 与 比较 。 最 后 的 总 结 部 分 ， 我 们 探讨 基于 信任 的 推荐 系统 领域 中 技术 进展 和 公开 
的 挑战 ， 例 如 ， 推 荐 系统 中 的 信任 关系 可 视 化 ， 如 何 缓 解 推 荐 系统 中 信任 网 络 的 冷 启 动 ， 
推荐 过 程 中 不 信任 的 影响 ， 也 研究 了 社交 关系 中 隐 含 的 其 他 类 型 关系 。 


20.1 简介 


协作 、 交 互 与 信息 共享 是 Web2. 0L48] 时 代 的 驱动 力 。Web2. 0 时 代 的 这 些 特 性 也 催生 了 
博客 (即时 分 享 想法 的 在 线 日 记 或 日 志 )、FOAF(Friend-OfF-A-Friend) 文件 (描述 一 个 人 特性 
的 机 器 可 读 的 文档 ， 包 括 人 与 其 相互 作用 物体 或 人 之 间 的 关联 )、 维 基 ?( 像 Wikipedia 这 样 允 
许 人 们 共同 添加 并 编辑 内 容 的 Web 应 用 ) 和 社交 网 站 (如 FaceBook 9 、 交 友 网 站 、 车 迷 论 坛 等 
让 有 着 共同 兴趣 的 人 们 可 以 交互 的 虚拟 社区 )。 本 章 集中 于 Web2. 0 中 的 一 类 特别 应 用 一 一 社 
交 推 荐 系统 。 这 类 推荐 系统 根据 用 户 个 人 资料 和 用 户 间 关系 做 出 预测 。 如 今 ， 在 虚拟 世界 中 
网 络 社交 关系 随处 可 见 ， 如 比较 流行 的 FaceBook, LinkedIn 和 MSN® 等 。 

研究 显示 相对 于 根据 相似 匿名 用 户 的 在 线 系统 的 推荐 ， 人 们 更 倾向 于 依赖 他 们 信任 朋 
友 的 推荐 [57]。 伴 随 着 社交 网 络 的 日 益 发 展 和 电子 商务 与 推荐 系统 的 结合 ， 人 们 对 信任 增 
强 推荐 系统 产生 了 越 来 越 多 的 兴趣 。 信 任 增强 推荐 系统 产生 的 推荐 是 基于 信任 网 络 ( 社 区 
成 员 间 彼此 的 信任 的 一 种 社交 网 络 ) 的 信息 。 一 个 典型 的 例子 是 Golbeck 创办 的 具备 电影 
评级 和 评论 功能 的 网 站 FilmTrust [16]。 该 网 站 要 求 用 户 对 他 们 熟悉 的 电影 进行 评分 ， 分 
值 范 围 为 1~10。 还 有 一 个 例子 是 电 商 网 站 Epinions， 在 该 网 站 维护 的 信任 网 络 中 ， 用 户 
可 以 根据 某 人 对 物品 的 评点 质量 来 标注 他 们 信任 和 不 信任 该 成 员 。 用 户 可 以 看 到 信任 他 的 
AAP, 但 看 不 到 不 信任 他 的 用 户 。 

信任 增强 推荐 系统 使 用 的 知识 来 自 于 能 够 生成 更 个 性 化 推荐 信息 的 信任 网 络 。 该 网 络 
中 用 户 接受 根据 信任 网 络 排 在 较 前 位 置 的 一 些 推 荐 物品 ， 或 者 甚至 是 他 们 信任 网 中 可 信 朋 
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友 的 推荐 L7，16，46，61]j。 这 些 推荐 系统 的 主要 优势 是 使 用 了 信任 传播 和 聚合 算 子 。 该 
类 算 子 主要 原理 是 估计 传递 的 信任 : 一 种 情况 是 已 知 用户 a 到 用 户 2 的 信任 值 和 用 户 2 到 
FAP c 的 信任 值 来 计算 用 户 a WAP c 的 信任 值 ( 传 播 ); 另 一 种 情况 是 把 几 个 信任 评估 合 
并 成 一 个 最 终 的 信任 值 ( 聚 合 ) 。 传 播 和 聚合 是 信任 度 的 两 个 重要 的 基石 ， 信 任 度 是 评估 网 
络 中 两 个 陌生 用 户 间 的 信任 程度 。 

除了 信任 ， 用 户 间 (用 户 都 有 各 自 的 意图 、 喜 好 和 观点 ) 自然 也 可 能 产生 不 信任 。 例 
如 ，Epinions 网 站 首先 提出 了 把 用 户 放 进 信任 名 单 ( 基 于 他 们 作为 一 个 评论 者 的 质量 ) ， 然 
后 增加 了 不 信任 名 单 。 不 信任 名 单反 映 了 该 用 户 对 某 些 用 户 的 不 信任 。 信 任 与 不 信任 名 单 
信息 用 于 对 提出 的 评论 进行 个 性 化 排序 。 从 研究 的 角度 看 ， 尽 管 不 信任 起 着 非常 重要 的 作 
用 [21，62，68]， 但 该 领域 研究 目前 只 是 处 于 起 步 阶 段 。 

推荐 技术 和 信任 度 构 成 信任 增强 推荐 系统 的 两 大 支柱 。 由 于 本 书 的 其 他 部 分 对 推荐 技 
术 进 行 了 详尽 的 介绍 ， 本 章 对 此 只 限于 介绍 必要 部 分 。 另 外 ， 我 们 假设 大 多 数 读者 对 信任 
研究 领域 不 太 熟 悉 。 因 此 ， 在 接 下 来 的 章节 中 ， 我 们 会 首先 讨论 基本 的 信任 概念 ， 如 信任 
和 不 信任 模型 、 传 播 和 聚合 。 本 章 讨论 的 核心 就 是 这 些 算 子 在 推荐 系统 中 的 应 用 。 这 些 概 
念 对 于 完全 掌握 信任 增强 推荐 系统 的 技术 原理 是 非常 必要 的 ， 对 此 我 们 将 在 20. 3 节 中 讨 
论 。 作 为 本 章 的 核心 部 分 ， 我 们 将 重点 放 在 信任 度 及 其 算 子 的 应 用 上 。 其 次 ， 我 们 解释 了 
推荐 算法 中 使 用 信任 度 的 好 处 ， 并 且 简 要 介绍 了 信任 增强 推荐 系统 中 的 最 新 方法 。 此 外 ， 
我 们 详细 介绍 了 三 个 知名 的 信任 系统 ， 并 对 它们 的 性 能 进行 了 分 析 比 较 。 最 后 ， 我 们 在 
_ 20.4 节 探讨 推荐 系统 领域 的 一 些 进展 和 公开 的 挑战 ， 如 推荐 系统 中 的 信任 关系 可 视 化 ， 
如 何 缓解 推荐 系统 中 信任 网 络 的 冷 启动 ， 推 荐 过 程 中 不 信任 的 影响 ， 也 研究 了 社交 关系 中 
潜在 的 其 他 类 型 。20. 5 节 是 本 章 结 论 。 


20.2 信任 的 表示 与 计算 


本 节 对 用 户 间 计算 信任 进行 基本 的 介绍 。 在 一 个 社会 化 信任 网 络 中 ， 这 意味 着 我 们 需要 
建立 信任 模型 (20. 2. 1 节 ， 如 何 表示 和 处 理 信任 与 不 信任 )， 信 任 传 播 算 子 (20. 2. 2.1 节 ， 如 
何 通过 用 户 间 通路 的 信息 来 估计 两 个 用 户 间 的 信任 值 ) 和 信任 聚合 算 子 (20. 2. 2. 2 节 ， 如 何 合 
并 由 多 条 连通 路 径 生 成 的 信任 值 ) 。 我 们 通过 经 典 的 和 新 颖 的 例子 来 解释 这 些 概念 。 

但 是 我 们 并 未 阐述 信任 网 络 中 的 其 他 概念 ， 如 信任 更 新 和 信任 引导 等 。 因 为 我 们 的 主 
要 目的 是 让 读者 熟悉 计算 信任 领域 的 主要 概念 ， 以 便 读者 能 更 容易 理解 20. 3 节 中 的 信任 
增强 推荐 技术 的 原理 和 细节 。 


20.2.1 信任 表示 


信任 模型 可 以 按照 不 同 的 方式 进行 分 类 。 本 章 主要 集中 在 两 种 分 类 方式 ， 即 概率 与 渐 
进 方法 ， 以 及 单 信任 表示 方法 与 信任 和 不 信 s. eRe 
任 的 表示 方法 。 表 20.1 针对 每 种 分 类 方法 
给 出 了 一 些 有 代表 性 的 参考 论文 。 

概率 方法 以 0 或 者 1 代表 用 户 的 信任 
值 ， 即 一 个 用 户 要 么 可 信 ， 要 么 不 可 信 ， 并 
用 于 计算 一 个 用 户 被 信任 的 概率 。 这 种 情况 
下 ， 一 个 越 高 的 信任 值 就 意味 着 用 户 越 可 能 — 75 
被 信任 。 在 文献 [66] 中 ，Zaihrayeu 等 提出 
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一 个 扩展 的 推理 框架 。 这 个 框架 考虑 了 用 户 间 的 信任 ， 也 考虑 了 用 户 和 系统 源 部 件 之 间 的 
信任 。[55] 集 中 于 计算 应 用 中 的 信任 ， 这 些 应 用 包含 了 语义 信息 ， 如 文献 服务 器 ， 或 者 像 
文献 [32] 中 提 到 的 使 用 信任 系统 的 社区 博客 更 具 抗 攻 击 性 。 在 虚拟 网 络 中 ， 信 任 是 建立 在 
用 户 间 正 负面 信息 传递 的 基础 上 的 ， 如 Kamvar 等 设计 的 P2P 网 络 Eigentrust[28]， 或 者 
Noh 的 基于 社会 网 络 反 馈 的 正式 模型 [44]。 文 献 L[25] 和 [51] 使 用 了 一 个 主观 逻辑 框架 来 表 
示 信 任 值 。[25] 在 IT 设备 中 量化 和 推理 信任 ， 而 [51] 在 P2P 系统 中 计算 用 户 的 信任 度 。 

而 渐进 的 方法 是 当 行 为 产生 一 定 程度 的 正 向 作用 的 时 候 估计 信任 值 ， 即 提供 的 信息 一 
定 程 度 上 对 或 错 ， 并 不 是 完全 对 或 者 错 ( 如 [1，11，15，21，35，59，68])。 在 渐进 方式 
下 ， 信 任 值 不 是 用 概率 方法 解释 的 : 一 个 用 户 的 信任 值 越 高 就 意味 着 信任 越 高 。 在 这 种 情 
况 下 信任 值 的 排序 是 一 个 非常 重要 的 因素 。 其 实在 现实 生活 中 也 如 此 ， 信 任 通常 是 一 种 渐 
进 现象 ; 人 们 不 是 信任 或 者 不 信任 某 人 ， 而 是 某 种 程度 上 信任 某 人 。 与 确定 性 的 数学 方法 
相 比较 ， 模 糊 逻 辑 [29，65] 是 一 种 非常 适合 表示 这 样 的 模糊 区 间 的 自然 语言 标签 。 例 如 ， 
在 [59] 和 [31] 中 ， 模 糊 语言 学 术语 用 来 在 P2P 网 络 的 用 户 中 表示 信任 ， 在 社交 网 络 中 也 如 
此 。 在 文献 [1] 中 提 到 了 一 个 经 典 的 例子 来 表示 信任 的 渐进 性 。 在 该 文中 用 4 个 值 来 表示 
信任 程度 : 非常 信任 、 信 任 、 不 信任 、 非 常 不 信任 。 

最 近 几 年 ， 渐 进 信任 方法 得 到 越 来 越 广泛 的 应 用 。 范 围 覆盖 社会 认 知 模型 (如 利用 模 
糊 认 知 图 L12])， 网 络 上 选择 好 的 交流 对 象 管理 机 制 L59]， 或 者 普 适 计算 环境 (Almenarez 
等 的 PTM[3]) ， 推 荐 系统 中 有 用 性 的 表示 [15，35] 及 为 语义 网 应 用 设计 的 模型 [68] 。 

相对 于 信任 模型 被 逐渐 建立 ， 不 信任 模型 却 很 少 被 研究 。 大 多 数 方法 都 没有 研究 不 信 
任 (L31，32，43，55，66])， 或 把 信任 和 不 信任 作为 同一 连续 度量 区 间 下 的 两 端 来 讨论 
[1，19，59]， 然 而 ， 在 用 户 网 络 理论 中 逐渐 产生 一 种 观点 认为 不 信任 与 缺乏 信任 是 等 价 
的 L[10，13，34]。 在 心理 学 领域 中 也 存在 一 些 呼 声 ， 要 求 重新 认定 正 负 感 觉 是 不 可 分 割 的 
假设 L8，50，52]。 一 些 研究 者 甚至 认为 信任 和 不 信任 并 不 是 相对 的 ， 在 某 种 情况 下 可 能 
同时 发 生 [9，33] 。 

就 我 们 所 知 ， 只 有 一 个 概率 模型 Josang 的 主观 逻辑 [24，25] 中 考虑 了 信任 和 不 信任 
同时 存在 的 情况 L24，25]。 文 中 假设 用 户 被 信任 值 为 bp， 不 信任 值 为 d 以 及 一 个 不 确定 值 
u。 不 确定 表示 还 有 部 分 未 知 ， 但 是 必须 满足 b 十 d 十 u=1， 排 除了 不 一 致 性 。 但 其 实在 大 
型 网 络 中 由 于 信息 源 的 冲突 不 一 致 性 是 很 常见 的 [60] 。 

[11，21，62，68] 中 给 出 了 信任 和 不 信任 同时 存在 的 渐进 模型 。Guha 等 用 一 对 (1， 
d) 来 表示 信任 和 不 信任 ， 其 取 值 都 在 [0，1]。 而 在 文献 [21] 中 ， 他 们 用 t-d 来 表示 信任 
值 。 文献 [62] 中 提 到 ， 当 不 区 分 信任 和 不 信任 时 ， 很 多 潜在 的 重要 信息 都 丢失 了 。 例 如 ， 
一 种 情况 是 有 0.2 的 信任 度 ，0 的 不 信任 度 ， 而 另 一 种 情况 是 0.6 的 信任 度 ，0. 4 的 不 信 
任 度 ， 最 后 两 者 的 信任 值 却 都 是 0.2, 但 显然 上 面 两 种 情况 提供 的 信息 差异 是 很 大 的 。 为 
了 处 理 Guha 和 Josang 方法 中 的 这 个 问题 ，Victor 对 [11] 中 的 方法 进行 了 扩展 ， 在 [14] 中 
信任 和 不 信任 值 被 从 两 格 中 抽出 来 。 这 样 一 种 两 格 结构 能 够 解决 由 于 不 信任 或 者 知识 缺乏 
引起 的 信任 问题 ， 并 且 对 知识 太 少 或 太 多 造成 的 问题 提供 了 一 些 启发 ， 如 对 立 关系 、 信 息 
量 问 题 [62]。 . 

信任 和 信任 模型 用 在 计算 机 科学 的 许多 领域 和 很 广泛 的 应 用 产品 中 。 在 文献 [6] 中 ， 
Artz 和 Gil 进行 了 全 面 的 梳理 ， 把 信任 研究 分 成 四 个 主要 方向 : 利用 策略 来 建立 信任 模型 
(访问 策略 、 管 理 凭 证 等 )、 通 用 模型 [12，68]、 信 息 源 信 任 模型 [66] 和 基于 信誉 的 信任 模 
型 。 后 者 包括 研究 一 个 用 户 以 前 的 行为 举止 [28，46] 和 社交 网 络 中 计算 信任 [21，36]。 
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20. 3 节 中 的 信任 增强 推荐 技术 就 属于 这 一 类 别 。 
20.2.2 信任 计算 


线 上 信任 网 络 中 ， 大 多 数 其 他 用 户 通常 都 不 认识 某 个 特定 用 户 。 当 然 在 某 些 情况 下 ， 
我 们 根据 某 些 信息 ， 可 以 推出 一 个 陌生 用 户 是 否 值得 信任 ， 以 及 在 多 大 程度 上 值得 信任 。 
在 推荐 系统 中 ， 如 果 没 有 自己 认识 的 用 户 对 他 (她 ) 有 兴趣 的 商品 打 过 分 ， 而 只 有 一 些 陌 生 
的 用 户 ( 来 自信 任 网 络 ) 打 过 分 ， 那 么 上 面 所 说 的 这 种 推断 陌生 用 户 可 信 度 的 方法 是 非常 重 
要 的 。 例 如 ， 在 Epinions 网 站 中 ， 大 约 每 个 用 户 的 平均 信任 用 户 为 1.7 个 ，Epinions 网 站 
总 共有 超过 70 万 用 户 [61]。 换 句 话说 ， 该 网 中 一 个 用 户 的 信任 网 络 只 包含 了 该 社区 中 的 
很 少 一 部 分 用 户 。 因 此 ， 能 够 利用 更 多 的 用 户 的 信息 生成 推荐 是 非常 有 用 的 。 

信任 度 是 根据 网 络 上 存在 的 其 他 用 户 间 的 信任 关系 来 估算 出 一 个 用 户 到 底 应 该 在 多 大 
程度 上 相信 另 一 个 用 户 。 信 任 度 有 多 种 度量 方法 ，[68] 对 此 有 一 个 不 错 的 总 结 。 该 文中 ， 
Ziegler 和 Lausen 从 三 个 不 同 纬度 对 信任 度 进行 分 类 : 成 对 与 成 组 方式 ; 集中 与 分 布 方式 ; 
全 局 与 局 部 方式 。 第 一 类 是 指 信任 关系 被 评估 的 方法 ， 第 二 类 是 信任 评估 被 计算 的 位 置 ， 
第 三 类 是 从 网 络 角度 考虑 ， 信 任 度 可 以 是 所 有 用 户 及 其 关系 的 评估 [28，44，55]， 或 者 是 
信任 网 络 中 部 分 用 户 及 其 关系 的 评估 ， 这 种 方式 是 带 有 个 人 偏见 的 如 [15，21，35]。20. 3 
节 中 的 信任 技术 属于 后 者 。 
20.2.2.1 传播 

信任 度 通 常 使 用 的 技术 是 以 信任 可 以 传递 为 假设 的 ， 我们 称 这 些 技术 为 信任 传播 策 
略 。 从 图 20. 1 中 可 以 看 到 ， 如 果 用 户 a 信任 00 s 


FAP b( 被 信任 第 三 方 ， 简 写 为 TPP)，2 信任 2 $ 8 
用 户 c， 那 么 假设 a 在 某 种 程度 上 信任 c 也 是 
合理 的 。 这 种 基本 的 传播 策略 被 称 为 原子 级 mc o 


直接 传播 ， 是 后 面 重 点 研究 的 传播 类 型 。 然 
而 ， 信 任 不 一 定 总 是 具有 传递 性 的 。 例 如 ， “ d 
如 果 Jane 相信 Alice 会 给 他 做 一 个 好 看 的 发 e e e 
HH, Alice 相信 John 能 给 她 修好 自行 车 ， 但 
并 不 意味 着 Jane 相信 John 会 给 她 修 自行 车 ， 
也 不 意味 着 给 她 做 一 个 好 看 的 发 型 。 

但 是 ， 在 某 些 情况 下 ， 信 任 是 可 以 传递 图 20.1 传播 实例 
的 L26]。 假 如 Jane 是 一 个 镇 上 的 新 居民 ， 她 
想 理发 。Jane 相信 Alice 能 够 找到 一 个 好 的 理发 师 ，Alice 相信 Mariah 是 一 个 好 的 理发 师 。 
因此 Jane 相信 Mariah 是 一 个 好 的 理发 师 。 这 个 例子 告诉 我 们 必须 区 分 功能 性 信任 (如 Al- 
ice 信任 Mariah) 和 推荐 性 信任 (如 Jane 信任 Alice)L1，26]。 如 [26] 所 述 ， 让 信任 变 得 可 
传递 是 传播 路 径 可 以 被 看 作 一 个 以 功能 信任 范围 结束 的 推荐 信任 部 分 传递 链 。 

当 仅 处 理 信任 时 ， 在 概率 方式 下 ， 乘 法 常用 作 标 准 传播 算 子 [55]。 这 也 是 一 种 渐进 方式 
[3，15，21]， 事 实 上 有 多 种 传播 算 子 ， 这 依赖 于 应 用 的 目标 和 场景 。 下 面 就 是 一 个 实例 。 


假设 信任 度 取 值 范围 为 [0，1]， 用 户 a XERIP b 的 信任 度 为 0.5， 用 户 5 对 


O ”如 要 讨论 别 的 信任 传播 策略 ， 如 分 析 、 信 任 转 置 、 耦 合 等 可 参见 [21] 。 
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FAP c 的 信任 度 为 0.7， 则 概率 方式 下 (标准 乘法 ) ， 信 任 传播 产生 0. 35。 但 是 在 模糊 逻辑 
方式 下 ， 最 后 的 信任 值 依 赖 于 所 取 算 子 : 如 果 传 播 链 只 考虑 最 弱 链 ， 那 么 传播 算 子 就 选择 
最 小 信任 值 ， 从 而 在 上 面 的 例子 中 生成 0.5 信任 值 。 如 选择 Eukasiewicz 结合 算 子 ， 即 
max(t;—t,—1, 0), ， 则 会 产生 信任 度 为 0.2。 类 似 于 乘法 算 子 ， 这 种 传播 信任 值 将 同时 受 
两 个 链 的 影响 ， 而 不 仅 是 最 弱 链 的 影响 。 

另外 的 一 些 信 任 传播 技术 有 : 模糊 ithen 规则 [31，59]， 扩 散 激活 理论 模型 [68]， 
TTP 信任 和 其 感觉 间 的 语义 距离 [1j。 

当然 并 不 是 所 有 的 传播 路 径 都 有 相同 的 长 度 。 图 20. 1 中 可 见 ， 从 用 户 a 到 用 户 c 有 
两 条 路 径 。 如 果 我 们 假设 网 络 中 所 有 的 边 都 表示 完全 信任 。 我 们 会 直观 感觉 到 第 二 条 路 径 
的 信任 度 要 低 于 第 一 条 路 径 。 因 为 两 者 距离 更 远 。 在 传播 策略 中 经 常会 提 到 信任 延 时 
[20]。 如 Ziegler 在 [68] 中 的 信任 延 时 是 通过 扩散 因子 组 合 起 来 的 。Golbeck 只 考虑 了 最 短 
路 径 [15]， 使 用 了 概率 信任 而 不 是 渐进 信任 。Massa 使 用 基于 用 户 距 离 的 传播 信任 [35]。 

在 原子 级 传播 方式 下 ， 如 果 a 信任 2，2 信任 c， 则 a 也 在 某 种 程度 上 信任 <。 类 似 地 ， 
如 果 a 信任 6，6。 不 信任 <， 则 a 在 某 种 程度 上 不 信任 <。 然 而 ， 当 我 们 在 传播 链 上 人 允许 另 
一 条 边 代表 不 信任 的 时 候 ， 情 况 就 变 得 更 复杂 了 。 例 如 ， 如 果 a 不 信任 6，6。 不 信任 <， 则 
a 对 c 的 信任 估计 就 可 能 出 现 几 种 情况 : 一 种 可 能 是 a 会 信任 <， 因 为 a 可 能 认为 6( 自 己 
不 信任 的 人 ) 不 信任 的 人 < 反而 是 朋友 (敌人 的 敌人 就 是 朋友 )。 也 有 可 能 a 不 信任 c<。 因 为 
a 认为 被 某 个 人 不 信任 的 人 肯定 是 不 值得 信任 的 。 

Guha 等 把 第 二 种 策略 叫 作 加 法 不 信任 传播 ， 第 一 种 叫 作 乘法 不 信任 传播 L[21]。[68] 讨 
论 了 乘法 传播 的 负 效应 。 但 是 也 总 结 出 由 于 具备 哲学 上 的 可 辩论 性 ， 不 能 被 忽略 。 其 他 的 研 
究 者 也 提出 和 第 一 种 策略 密切 相关 的 算 子 。 例 如 ，Victor 等 的 方法 使 用 了 模糊 逻辑 [62]， 或 
者 Josang 等 提出 的 亲 对 立 面 折扣 算 子 [27]。 后 一 种 策略 的 例子 见 L[21，27，62] 。 < 

和 信任 传播 类 似 ， 不 信任 传播 方法 也 是 用 信任 和 不 信任 表示 亲密 关联 。 假 设 
我 们 用 (+，4d) 分 别 表示 信任 和 不 信任 ， 取 值 都 在 LO0，1]。(1，0) 表 示 完 全 信任 ，(0，1) 表 
示 完 全 不 信任 ，(0，0) 表 示 完 全 不 了 解 。 渐 进 值 如 (0.5，0. 2) 表 示 0.5 的 信任 ，0. 2 的 不 
信任 ， 也 有 部 分 不 了 解 1 一 0.5 一 0. 2==0.3。 假 设 ac 对 2 的 信任 范围 是 (11 di), 5 对 c 的 
信任 范围 是 (t,，d;)， 则 a 对 < 的 信任 范围 可 以 通过 计算 [62] 得 

(tz 5d3) = (t X te sti X dz) 

传播 策略 反映 了 你 采纳 信任 者 的 意见 ， 而 不 会 从 不 信任 或 者 不 知道 的 第 三 方 采纳 意见 
的 态度 。 以 下 是 传播 信任 值 的 一 些 例子 。 行 代表 a 对 2 的 信任 值 ， 列 代表 6 对 < 的 信任 值 ， 
对 应 表 中 也 包含 了 a 对 c 的 信任 值 。 

















0.0)(0.0, 1.00 (1.0, 0.0)(0.5, 0.2) 
0. 00€(0. 0, 0.0)(0.0, 0.00(0.0, 0.0) 
(0.0, 0.0)(0.0, 0.050. 0, 0.0)(0.0, 0.0) 
(0.0, 0.0)(0.0, 1.00(1. 0, 0.0)(0.5, 0.2) 
(0.0, 0.0)(0. 0, 0.5)(0.5, 0.0)(0. 25, 0.1) 









(0.0, 1.0) 
(1.0, 0.0) 
(0.5, 0.2) 


文献 [25] 中 用 这 种 传播 技术 来 合并 信任 和 不 信任 。 文 献 [21] 中 提 到 的 一 种 传播 策略 是 
从 信任 度 中 减 去 不 信任 度 ， 则 传播 信任 值 为 i X (ts 一 d;)。 < 


FAP a 对 用 户 c 的 信任 度 (ts ，ds) 可 以 通过 如 下 公式 计算 [62] 
(55 ,d3) m Ct X te +d, Xd — ti X te Xd X do st; X d; +d, X f$ — fi Xd; Xd Xt;) 
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在 这 个 传播 策略 中 ,ts Æ t Xt 和 di Xd, WERA, d: Æ tı Xd, fd Xi 的 概率 
和 。 隐 含 的 假设 是 一 个 不 信任 用 户 有 意 给 了 错误 的 信息 。 因 此 ， 如 果 a 信任 的 人 告诉 他 要 
信任 <， 则 他 会 信任 c<， 如 果 a 不 信任 的 人 告诉 他 要 信 c， 则 他 会 信任 c( 即 敌人 的 敌人 就 是 
朋友 )。 从 信任 度 中 减 去 不 信任 度 ， 则 产生 值 为 (t 一 41) X(ts 一 4d,)，[21j 提 出 了 不 信任 传 
播 策略 。 下 面 是 一 个 传播 信任 值 的 例子 。 


(0.0, 0.0)(0.0, 1.0)(1.0, 0.0940, 5, 0.2) 
(0.0, 0.0) | (0.0, 0.0)(0.0, 0.0)(0.0, 0.0)(0.0, 0.0) 
(0.0, 1.0) | (0.0, 0.0)(1.0, 0.0)(0.0, 0.1)(0.2, 0.5) 
(1.0, 0.0) | (0.0, 0.00(0.0, 1.0)(1.0, 0.0)(0.5, 0.2) 
(0.5, 0.2) | (0.0, 0.0)(0.2, 0.5)(0.5, 0.2)(0. 28, 0.2) 





所 有 的 这 些 方法 都 表明 到 目前 为 止 人 们 对 不 信任 的 传播 机 制 没 有 达成 共识 。 人 们 基于 
不 同 的 解释 提出 相应 的 算 子 从 而 产生 了 不 同 的 结果 。 这 显示 在 应 用 中 选择 合适 的 传播 模式 
上 是 一 个 复杂 的 问题 。 < 
20.2.2.2 RF 


除了 传播 ， 信 任 度量 还 有 聚合 策略 。 毕 竟 ， 在 一 个 大 型 网 络 中 ， 一 个 用 户 的 信任 值 需 
要 通过 几 条 路 径 获 得 。 在 这 种 情况 下 ， 从 不 


"———— 
LLL CTI TR 
ee 
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和 、 平 均值 或 者 加 权 平 均等 [1，3，19，28， 
43，44，55]。 加 权 算 子 让 我 们 可 以 有 机 会 考虑 
一 些 相对 更 重要 的 信息 源 ( 如 TTP 或 传播 路 径 )。 A 


同 传播 路 径 获 得 的 信任 值 必须 聚合 成 一 个 值 。 .5 
实例 见 图 20. 2。 -A-A-A 
常用 的 聚合 算 子 有 最 小 值 、 最 大 值 、 加 权 A "S 4i 


换 名 话说， 加权 算 子 使 得 聚合 过 程 更 灵 
活 。 目 前 为 止 ， 信 任 和 不 信任 聚合 还 没有 得 
到 太 多 的 关注 。 只 有 Josang 等 为 主观 逻辑 框 
架 提出 了 三 个 聚合 算 子 [27]， 但 是 他 们 在 里 
面 假设 用 户 重要 性 是 一 样 的 。 

值得 注意 的 是 ， 传 播 和 聚合 经 常 必须 在 一 起 使 用 ， 而 且 最 后 的 信任 评估 依赖 于 实现 的 
方式 。 从 图 20.2 我 们 可 以 看 到 ， 用 户 a 通过 用 户 获得 对 用 户 c 的 信任 评估 有 两 种 方式 。 
第 一 种 方式 是 通过 两 条 路 径 把 信任 从 用 户 a 传播 用 户 。<， 一 条 路 径 是 a 一 b>d 一 c， 另 一 条 
是 a>b>e 一 f>c<， 然 后 把 两 条 路 径 的 传播 信任 结果 聚合 在 一 起 。 这 种 方式 下 ， 信 任 首先 
被 传播 ， 然 后 被 聚合 (FPTA) 。 第 二 种 方式 相反 ， 是 先 聚 合 后 传播 。 这 种 方式 下 ， 第 三 方 
用 户 5 必须 先 聚 合 来 自 4 Me 的 信任 ， 然 后 把 新 的 信任 传递 给 a。 可 以 看 到 ， 后 者 比 前 者 
接受 了 更 多 的 责任 。 信 任 可 以 通过 分 布 式 进行 计算 。 而 不 用 用 户 暴露 他 们 个 人 的 信任 或 不 
信任 信息 。 

GEID 520.2 中 从 用 户 a 到 用 户 c 有 三 条 不 同 的 路 径 。 假 设 在 最 上 面 一 条 路 径 中 ， 
除了 最 后 一 条 边 的 权重 为 0. 9， 所 有 其 他 边 的 信任 权重 都 为 1， 使 用 乘法 作为 传播 算 子 ， 则 
该 路 径 传播 的 信任 度 就 为 0. 9。 现 在 ， 假 如 用 户 a 对 6 的 信任 度 为 1, 5 对 4 的 信任 度 为 0. 5， 
d 对 e 的 信任 度 为 0. 8。 这 就 意味 着 从 用 户 a 通过 用 户 5 传播 到 用 户 c 的 两 条 路 径 信任 度 分 别 


图 20.2 聚合 实例 
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3j 1X0. 5X0. 4—0. 2 和 1X0.8X0.6X0.7=0.34。 使 用 平均 值 为 聚合 算 子 ，FTTA 最 后 产生 
的 信任 度 为 (0. 9+0. 2 十 0. 34)/3=0. 48。 另 一 方面 ， 假 如 我 们 让 用 户 5 首先 聚合 来 自 自 身 的 
信任 网 络 ， 则 4 会 传播 信任 度 (0.2 十 0.34)/2=0.27 给 用 户 a。 在 FATP 策略 下 ,根据 图 
20.2， 则 从 用 户 c 到 用 户 a 传播 信任 度 为 (0. 9 十 0. 27) /2—0. 59, 4 


20.3 信任 增强 推荐 系统 


信任 增强 推荐 系统 研究 的 第 二 个 支柱 是 推荐 系统 技术 。 推 荐 系统 常用 于 精确 预测 一 个 
用 户 对 某 一 特别 物品 的 喜欢 程度 。 在 许多 论文 中 对 这 些 算法 都 有 介绍 C2, 54]. WER 
广泛 使 用 的 推荐 方法 有 基于 内 容 的 推荐 (第 3 章 ) 和 基于 协同 过 滤 推 荐 (第 5 章 )。 基 于 内 容 
的 推荐 方法 会 推荐 一 些 物品 ， 这 些 物品 与 用 户 曾经 喜欢 过 的 物品 具有 很 大 的 相似 性 。 这 种 
方法 往往 会 限制 推荐 范围 L56]， 因 此 ， 这 种 方法 倾向 于 把 推荐 限制 在 和 用 户 购 买 过 或 者 评 
分 过 的 商品 很 近似 的 范围 内 。 如 一 个 用 户 a 以 前 只 是 租赁 了 浪漫 电影 ， 那 系统 就 将 只 推荐 
相关 的 浪漫 电影 ， 不 会 推荐 用 户 可 能 感 兴趣 的 另外 类 型 电影 。 使 用 协同 推荐 技术 可 以 显著 
改进 推荐 系统 的 推荐 效果 。 这 种 方式 首先 识别 某 一 用 户 和 哪些 客户 具有 相似 品味 (如 邻 
居 )， 然 后 基于 这 些 邻 居 的 行为 来 对 该 用 户 的 行为 做 出 预测 [53] 。 

20.4 节 将 讨论 经 典 推荐 系统 的 不 足 之 处 ， 并 且 讨 论 如 何 通 过 结合 系统 中 用 户 信任 网 
络 来 缓解 这 些 问题 。 这 些 先进 的 基于 信任 的 推荐 技术 和 协同 过 滤 技 术 是 紧密 结合 的 。 在 这 
种 情况 下 ， 对 目标 物品 的 推荐 是 基于 其 他 用 户 对 这 个 物品 的 评分 得 到 的 ， 而 不 是 对 于 物品 
本 身 属性 和 内 容 的 分 析 。Golbeck 在 文献 [17] 中 详细 全 面 阐述 了 信任 系统 领域 ,特别 是 信 
任 增强 推荐 系统 中 的 一 些 经 典 和 新 颖 的 研究 工作 。 


20.3.1 动机 


尽管 推荐 方法 有 了 显著 的 改善 ， 但 是 仍然 存在 一 些 重 要 的 问题 。Massa 和 Avesani 在 
[37] 中 讨论 了 一 些 协 同 过 滤 系统 的 缺点 。 例 如 ， 用 户 通常 都 会 给 少数 的 物品 打分 ， 这 就 使 
得 矩阵 非常 稀疏 (一 个 推荐 系统 常会 处 理 数 以 百 万 的 物品 )。 例 如 ，Epinions 的 一 个 数据 集 
中 有 16 万 用 户 ，2500 万 条 评分 ，150 万 条 评论 [61]。 由 于 数据 的 稀疏 性 ， 当 想 在 系统 中 
使 用 协同 过 滤 来 识别 好 的 邻居 用 户 的 时 候 就 碰 到 许多 困难 。 这 种 情况 下 生成 的 推荐 的 质量 
也 得 不 到 保障 。 要 为 一 个 系统 的 新 用 户 生成 一 个 好 的 推荐 也 是 很 难 的 ， 例 如 ， 冷 启动 用 户 
因为 他 们 还 没有 对 一 定数 目的 物品 进行 打分 ， 不 能 找到 相似 的 用 户 群 。 第 三 ， 由 于 推荐 系 
统 在 电子 商务 中 的 广泛 应 用 ， 促 使 商家 利用 推荐 系统 算法 的 漏洞 ， 以 便 他 们 的 物品 能 够 更 
频繁 地 被 推荐 [67]。 例 如 ， 一 种 普通 的 “复制 身份 ”攻击 手段 通过 复制 目标 用 户 的 评分 物品 
给 自己 创造 的 恶意 用 户 ， 会 让 系统 误 认为 恶意 用 户 和 目标 用 户 的 品味 很 相似 。 最 后 ， 
Sinha 和 Swearingen 在 L57，58] 中 提 到 用 户 喜 欢 更 透明 的 系统 。 因为 人 们 更 愿意 相信 他 们 
信任 朋友 的 推荐 而 不 是 根据 与 他 们 相似 的 陌生 用 户 生成 的 推荐 。 

现实 生活 中 ， 某 人 有 时 喜欢 一 件 物品 ， 为 了 避 00 
免 上 当 ， 他 通常 会 更 愿意 参考 他 信任 的 朋友 a 的 意 oe? e e 
见 。 假 如 a 不 了 解 这 个 物品 ， 则 a 会 问 他 信任 的 朋 $- — ANC D 
友 5， 直 到 某 个 了 解 这 个 物品 的 朋友 。 信 任 增强 推 $ 
荐 系统 就 是 想 仿真 这 种 行为 ， 就 像 图 20. 3 中 描述 ”一 5 s 
的 这 样 ， 为 了 得 到 个 性 化 的 推荐 ， 一 旦 找到 了 一 条 iios MGR 
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推荐 路 径 ， 系 统 就 会 通过 可 得 的 信任 信息 (信任 传播 或 者 聚合 ) 来 合并 推荐 的 判断 ， 这 种 方 
式 下 ， 信 任 网 络 就 能 延伸 到 越 来 越 多 的 用 户 和 物品 。 
在 图 20. 4 的 协同 过 滤 设 置 中 ， 用 户 o 和 

用 户 b BT RA BEN EA. 建立 了 
关联 ， 用 户 5 和 用 户 c 建立 了 类 似 的 关联 。 结 
果 预 测 出 用 户 a 对 物品 i, 有 兴趣 。 但 是 在 这 CH 
个 场景 中 ， 用 户 a( 或 者 c) 和 物品 i, 之 间 并 没 
有 关联 ， 即 不 能 找到 物品 i 是 否 应 该 被 推荐 
给 用 户 a 的 理由 。 当 在 推荐 系统 中 的 用 户 间 
建立 了 信任 网 络 的 时 候 ， 这 种 情形 就 会 改变 
了 。 图 20. 4 的 实心 线 显示 用 户 a 和 用 户 5 之 图 20.4 推荐 系统 中 的 信任 关系 

间 ， 用 户 5。 和 用 户 c 之 间 存在 信任 关系 。 在 一 个 没有 信任 网 络 的 情形 下 ， 协 同 过 滤 系 统 不 
能 推荐 i 给 用 户 a， 而 在 信任 增强 情形 下 如 果 用 户 a 在 一 定 程度 上 信任 用 户 6， 用 户 6 
信任 用 户 c， 则 可 以 把 用 户 a 的 信任 传播 给 用 户 <。 如 果 结 果 显 示 用 户 a 对 用 户 c。 有 较 高 的 
信任 度 ， 则 对 于 用 户 am. i 也 许 就 是 一 个 好 的 推荐 ， 并 且 在 被 推荐 物品 中 排 在 较 高 的 
位 置 。 这 个 简单 的 例子 显示 通过 包含 信任 关系 来 扩大 推荐 系统 将 有 助 于 解决 稀疏 问题 。 其 
至 ， 信 任 增强 系统 也 会 缓解 冷 启动 问题 。 与 评分 信息 相 比 ， 给 同一 个 账号 添加 一 些 信任 关 
系 ， 则 系统 生成 的 推荐 会 越 来 越 准确 [35]。 甚 至 ， 信 任 网 络 可 以 产生 一 个 用 户 可 信 指 标 ， 
使 得 系统 更 健壮 ， 有 利于 抵御 恶意 人 侵 者 : 只 有 在 目标 用 户 明确 表达 了 对 插入 的 恶意 用 户 
的 信任 之 后 ,简单 的 “复制 身份 ”攻击 才 会 成 功 。 最 后 ， 与 “黑箱 ”方法 相 比 ， 信 任 增强 系统 
的 作用 (如 信任 传播 ) 让 用 户 更 容易 理解 。Golbeck 的 FilmTrust 系统 [16] 要 求 用 户 根据 他 
朋友 的 电影 品味 来 评价 他 的 朋友 ， 因 此 使 用 这 些 信息 就 可 以 生成 个 性 化 的 预测 。 





20.3.2 进展 


所 有 这 些 实例 都 显示 在 推荐 系统 的 用 户 中 建立 信任 网 络 将 显著 增强 推荐 性 能 。 有 些 学 
者 已 经 在 这 个 领域 进行 探索 [15，23，30，37，46，49，51]。 信 任 增强 推荐 系统 根据 信任 
值 采集 方式 的 不 同 可 以 分 为 两 类 。 第 一 类 是 信任 网 络 是 由 用 户 直 接 输 入 ， 例 如 ， 明 确 表示 
信任 ,然后 利用 该 信任 网 络 构 建 推荐 系统 ， 例 子 参见 [16，23，37]。 在 这 种 方式 下 ， 我 们 
可 以 利用 网 络 中 的 信任 传播 和 聚合 生成 最 终 的 信任 值 以 满足 推荐 系统 需求 。 第 二 类 需要 用 
户 对 他 的 朋友 进行 直接 评估 。 信 任 值 是 自动 生成 的 ， 可 以 基于 用 户 以 前 的 可 信 推 荐 [30， 
46]， 或 者 基于 相似 用 户 的 传递 性 [49] 。 

行为 学 中 已 经 对 “信任 ”有 了 明确 的 定义 。Mayer 等 在 文献 [40] 中 定义 的 信任 包含 了 能 
力 、 爱 心 、 正 直 和 倾向 等 四 个 主要 因素 。McAllister 在 文献 [41] 中 提出 了 信任 需要 区 分 是 
基于 认 知 的 还 是 基于 情感 的 。 然 而 ， 在 推荐 研究 领域 ,信任 被 看 成 人 际 关 系 的 一 个 总 称 ， 
特别 是 在 处 理 信任 值 自动 计算 时 。 在 这 种 情形 下 ， 信 任 被 用 来 表示 各 种 概念 ， 如 品味 的 相 
似 、 信 誉 、 能 力 评估 等 。 

在 20.4 节 ， 我 们 将 对 此 作 进 一 步 详 细 讨论 。 本 节 集 中 讨论 两 类 策略 ( 即 信 任 网 络 挖掘 
和 信任 值 自动 计算 )， 并 对 每 类 策略 的 代表 性 工作 进行 阐述 。 

20. 3. 2. 1 信任 网 络 挖掘 
大 部 分 信任 增强 推荐 策略 都 要 求 用 户 表 达 对 其 他 用 户 的 信任 情况 。TMoleskiing[7] 是 一 
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个 山地 滑雪 社区 网 站 。 在 这 个 网 站 里 ， 他 们 使 用 包含 信任 信息 的 FOAF 文件 ， 该 信任 值 的 域 
值 范 围 为 1~9[19]。 电 子 商务 网 站 Epioions 首先 要 求 用 户 提交 他 们 网 上 的 信任 用 户 和 不 信任 
用 户 ( 黑 名 单 )， 然 后 以 此 建立 信任 网 络 ， 网 站 再 根据 信任 网 络 对 评论 进行 排序 。 另 一 个 著名 
的 例子 是 Golbeck 的 FilmTrust[16]. FilmTrust 是 一 个 具有 电影 评分 和 评论 的 在 线 社交 网 站 。 
在 这 个 网 站 上 ， 用 户 被 要 求 对 他 熟悉 的 电影 喜爱 程度 进行 评分 ， 范 围 从 1 一 10 不 等 。 

这 些 系统 都 会 利用 信任 网 络 中 关系 来 确定 观点 和 评分 在 推荐 系统 的 权重 。 换 句 话 说 ， 
这 类 算法 都 会 使 用 信任 评价 来 作为 决策 过 程 中 的 权重 。 目 前 有 多 种 赋 权 方式 ， 在 这 节 ， 我 
们 会 集中 讨论 两 种 常用 的 方式 : 加 权 平 均 和 协同 过 滤 自 适应 机 制 。 我 们 用 一 个 众所周知 的 
实例 来 分 别 阐 述 它们 。 

基于 信任 的 加 权 平均 在 一 个 没有 信任 网 络 的 推荐 系统 中 ， 如 果 有 一 个 推荐 算法 需要 
求 出 用 户 对 某 一 物品 ;的 喜好 程度 ， 则 其 值 为 所 有 对 该 物品 熟悉 的 用 户 wx 对 物品 ;评分 rw 
的 均值 。 这 种 作为 基准 的 推荐 策略 可 以 通过 计算 基于 信任 的 加 权 平 均 来 改进 。 设 如 .表示 
用 户 a 对 评分 者 x 的 信任 程度 ， 算 法 允许 两 个 个 体 间 信 任 有 差别 。 现 任 ， 被 信任 程度 越 
高 ， 则 其 评分 权重 就 越 大 。 在 式 (20. 1) 中 ，p,,; 表 示 用 户 a 对 物品 i 的 预测 评分 ，R" 表示 
评价 物品 i 的 用 户 群 。 


bg = = _— (20. 1) 


TidalTrust 这 个 公式 是 Golbeck 等 的 推荐 算法 的 核心 L15]。 该 算法 的 创新 点 在 于 引入 
了 信任 估计 6,,。， 他 们 称 为 TidalTrust。 在 文献 [18] 中 ， 作 者 对 TidalTrust 的 研究 过 程 进 
行 了 全 面 的 介绍 。 在 每 一 个 实验 中 ， 他 们 先是 忽略 用 户 a 到 < 的 直接 信任 关系 ， 而 是 考虑 
a 到 < 的 其 他 全 部 路 径 。 简 而 言 之 ， 通 过 与 这 些 路 径 的 传播 的 信任 结果 与 潜在 的 、 隐 藏 的 
信任 值 比 较 ， 他 们 得 到 结论 : 1) 路 径 越 短 产生 的 信任 估计 越 准 确 ; 2) 包含 越 高 信任 值 的 路 
径 产 生 信任 结果 越 好 。 

从 第 一 条 我 们 知道 ， 只 有 越 短 的 路 径 才 会 产生 越 好 的 结果 。 但 是 ， 假 如 把 路 径 限 制 到 
一 定 长 度 ， 则 某 些 情形 下 ， 只 有 一 部 分 用 户 是 可 连通 的 。 这 种 情况 下 ， 我 们 可 以 设 定 一 个 
可 变 路 径 长 度 ， 即 把 某 用 户 ulu 是 评分 者 ， 对 物品 i 进行 了 评价 ) 连 通 的 最 短 长 度 作 为 算 
法 路 径 长 度 。 这 样 使 用 广度 优先 算法 搜索 的 深度 也 就 随 着 不 同 用户 而 变化 了 。 

而 第 二 条 ， 我 们 可 以 仅 使 用 最 信任 用 户 的 路 径 来 计算 。 然 而 ， 每 个 用 户 对 信任 度 都 有 
自己 不 同 的 理解 (一 些 用 户 可 能 常 给 出 相当 高 的 信任 度 ， 而 其 他 的 用 户 却 不 一 定 ) 。 另 外 ， 
经 常 只 有 几 条 路 径 具 有 一 样 的 高 信任 值 。 这 也 是 为 什么 Golbeck 等 提出 要 为 每 条 路 径 增加 
一 个 路 径 强度 (例如 ， 这 条 路 径 上 最 小 的 信任 值 )， 并 且 为 每 个 用 户 计算 所 有 连接 他 (她 ) 的 
路 径 的 所 有 路 径 强度 中 的 最 大 值 。 这 个 最 大 值 (max) 然 后 被 选择 作为 最 小 信任 阅 值 去 过 滤 
掉 过 于 小 的 信任 值 。 

式 (20. 2) 是 TidalTrust 公式 。 该 公式 中 WOT GO GR FH P a 的 信任 名 单 中 信任 度 超 
WA max 的 用 户 群 。 这 意味 着 计算 每 个 用 户 对 他 的 信任 者 的 信任 都 是 加 权 平 均 的 结果 ， 
即 只 考虑 那些 他 信任 对 象 中 信任 度 不 低 于 max 的 用 户 。 


2 dies 


n 
E d — ve WOT (a) (20. 2) 
tav 


v€ WOT* (a) 
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TidalTrust 是 一 个 递归 算法 ， 信 任 度 t,, 是 通过 递归 计算 获得 的 。 该 算法 首先 求 得 用 
F a 到 用 户 w 的 最 短路 径 ， 然 后 把 该 路 径 中 所 有 的 中 间 用 户 中 的 第 一 条 边 值 作为 tou AIA 
重 进行 加 权 平 均 计算 得 到 信任 度 i。,,。 用 户 保证 最 长 路 径 的 深度 不 会 超过 当前 路 径 长 度 。 
这 种 算法 是 渐进 信任 算法 ， 是 一 个 局 部 信任 度 实 例 。 

Golbeck 等 通过 比较 得 到 基于 信任 的 加 权 平 均 与 TidalTrust 相 结合 的 算法 不 一 定 比 计 
算 平 均值 或 者 使 用 协同 过 滤 更 好 。 但 是 对 于 那些 给 某 些 特定 商品 的 打分 与 平均 分 相差 很 大 
的 用 户 ， 这 类 方法 有 非常 显著 的 推荐 效果 [15，18]。 

基于 信任 的 协同 过 滤  Golbeck 的 方法 是 通过 加 权 平 均 实现 的 ， 而 信任 增强 推荐 系统 
的 另 一 类 方法 是 和 协同 过 滤 算法 紧密 相连 的 。 在 协同 过 滤 算 法 中 ,用 户 a 对 物品 i 的 评分 
可 以 通过 用 户 a 的 邻居 用 户 对 物品 i 的 评分 得 到 [53]， 如 式 (20. Br. 


E E D * 120, 3) 


AP a 对 物品 i 的 评分 P,,; 是 与 用 户 a 对 其 他 物品 的 评分 的 均值 和 其 他 用 户 对 物品 i 
的 评分 "相关 的 。 公 式 考 虑 了 用 户 a 和 用 户 的 相似 性 ww。,, (Pearson 相关 系数 )[22]。 实 
际 上 ， 这 里 只 考虑 了 那些 对 物品 i 评分 的 且 与 用 户 a 具有 正 相关 性 的 用 户 群 ， 记 为 RU. 
取代 基于 PCC 的 权重 计算 方法 ， 通 过 信任 网 络 中 的 用 户 关系 推测 出 权重 (传播 和 聚合 方 
式 )。 式 (20. 4) 与 式 (20.3) 相 比 ， 用 信任 度 上 取代 了 PPC 权重 w,,。 实 例 也 反映 了 信任 
和 相似 性 是 相关 的 ， 见 论文 [69]。 | 


Pai = 7, + SELL (20. 4) 

我 们 把 这 叫 作 基于 信任 的 协同 过 滤 。 由 于 权重 和 PCC 不 是 等 价 的 ， 可 能 会 产生 意 想 
不 到 的 结果 。 当 这 种 情况 发 生 的 时 候 ，z.,; 取 最 近 的 评分 值 。 

MoleTrust 式 (20.4) 是 以 Massa 等 的 推荐 算法 为 基础 的 。Massa 在 算法 中 提出 了 一 个 
新 的 信任 度 指标 ， 叫 MoleTrust。 该 指标 计算 由 两 步 构 成 。 第 一 步 ， 去 掉 信任 网 络 中 的 
环 ， 第 二 步 进行 信任 计算 。 由 于 信任 测试 集中 存在 大 量 的 信任 传播 (如 Epinion 中 的 大 样本 
测试 集 )， 因 此 首先 去 掉 环 会 增强 效率 ， 这 样 要 获得 信任 预测 值 ， 每 个 用 户 只 需 经 过 一 次 。 

信任 网 络 变 成 了 一 个 有 向 无 环 图 ， 因 此 找到 用 户 a 到 > 的 通路 就 能 够 得 到 上 的 信任 
预测 值 。 首 先 计算 距离 为 1 的 用 户 间 信 任 值 ， 然 后 计算 距离 为 2 的 用 户 间 信任 值 ， 以 此 类 
推 。 注 意 到 图 的 含 无 环 性 质 ， 距 离 为 xz 的 用 户 的 信任 值 只 依赖 于 已 经 计算 过 的 用 户 间距 离 
为 xz 一 1 的 信任 值 。 

用 户 间 距离 为 2 及 以 上 的 信任 值 的 计算 与 Golbeck 等 的 算法 ( 式 (20. 2)) 相 似 ， 但 是 与 
广度 优先 的 实现 还 是 有 很 大 差异 的 。 在 TidalTrust 算法 中 ， 只 有 当 用 户 u 位 于 用 户 a 到 物 
品 i 的 最 短路 径 上 ， 它 才 属 于 WOT (a). 

535^, fr MoleTrust 算法 中 ，WOT+ (4) 包含 所 有 的 对 物品 i 进行 评分 而 且 用 户 a 能 
够 直接 或 通过 传播 信任 关系 可 以 到 达 的 用 户 。 但 是 并 不 是 所 有 的 用 户 信 任 都 被 计算 : 在 计 
算 开始 前 ， 每 个 用 户 都 必须 被 分 配 一 个 值 d 给 传播 水 平 参数 。 这 样 ， 只 有 用 户 在 距离 d 内 
可 以 到 达 才 会 被 考虑 。MoleTrust 还 有 一 个 重要 的 输入 参数 是 运算 中 用 户 的 信任 阔 值 (与 
TidalTrust 算法 中 的 动态 最 大 阔 值 不 同 )。 在 文献 [38] 中 的 实例 中 用 0.6( 取 值 范围 为 0 到 
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1) 作 为 信任 阅 值 。 
与 TidalTrust 算法 类 似 ，MoleTrust 算法 属于 渐进 局 部 信任 度 方法 。Massa 和 Avesa- 
ni 在 实验 中 说 明 MoleTrust 算法 比 全 局 信任 度 算法 (如 eBay 的 算法 ) 有 更 好 的 信任 评估 效 
果 ， 尤 其 是 对 那些 有 争议 的 用 户 ( 这 些 用 户 被 某 一 组 用 户 信 任 而 不 被 另外 一 组 信任 )。 并 且 
与 经 典 的 协同 过 滤 系统 相 比较 ，MoleTrust 对 冷 启 动用 户 的 预测 效果 更 好 [35，36] 。 
Golbeck 和 Massa 的 方法 是 两 个 利用 信任 信息 的 信任 增强 推荐 技术 的 典型 例子 。 表 20. 2 
总 结 了 它们 的 最 突出 特点 。 在 [23，63] 中 也 提 到 了 一 些 在 推荐 方法 中 使 用 信任 网 络 的 技术 。 


表 20. 2 两 种 经 典 推荐 方法 的 异同 比较 


fen R 

聚合 基于 信任 的 加 权 平均 (20. 2) 

传播 路 径 最 大 值 静态 (水 平 参数 ) 

item = 

传播 中 TTP 需求 V 在 a lu 的 路 径 上 并 且 距 离 小 于 水 平 参数 
评分 预测 基于 信任 的 协同 过 滤 (20. 4) 


20.3.2.2 信任 自动 生成 


20.3.2. 1 节 讨 论 的 算法 都 要 求 用 户 要 直接 输入 信任 值 。 这 意味 着 使 用 这 种 算法 必须 
提供 一 种 能 够 获得 这 些 信 息 的 方法 ， 如 FilmTrus 和 Moleskiing。 但 很 多 时 候 ， 这 种 方法 
是 不 可 行 的 。 这 种 情况 下 ， 自 动 推断 出 信任 评价 而 不 需要 明确 的 信任 信息 的 方法 可 能 是 一 
个 更 好 的 解决 方案 。 这 样 的 系统 例子 可 以 在 [47] 找 到 。 

最 常见 的 方法 还 是 那些 基于 系统 中 用 户 历史 评分 行为 来 产生 信用 机 制 的 方法 。 一 个 用 
户 到 底 应 该 在 多 大 程度 上 参与 到 推荐 过 程 中 取决 于 他 在 过 去 准确 的 推荐 。 让 我 们 用 O' Do- 
novan 等 的 经 典 方 法 来 举例 说 明 [46] 。 

用 户 级 和 物品 级 信任 ”直觉 告诉 我 们 ， 一 个 在 过 去 做 出 了 许多 高 质量 推荐 的 用 户 ， 与 
做 得 较 差 的 用 户 相 比 ， 前 者 更 值得 信任 。 为 了 能 够 选择 最 值得 信任 的 用 户 ，O’ Donovan 引 
人 了 两 个 信任 度量 : 用 户 级 信任 和 物品 级 信任 。 该 两 个 度量 分 别 反映 一 个 用 户 的 综合 可 
信和 度 和 一 个 用 户 对 某 个 物品 i 的 评价 的 可 信和 度 。 为 了 计算 用 户 u 对 用 户 a 的 推荐 的 准确 
性 ， 这 两 个 信任 度 都 需要 。x,,; 表 示 用 户 a 对 物品 i 的 评分 ，p。,; 表 示 用 户 a 对 物品 i 评分 
的 预测 值 。 如 果 通 过 用 户 u 预测 出 pi 在 x; 误差 范围 <:， 则 认为 p,; 是 准确 的 。 

APRIRE t 表示 用 户 准确 推荐 的 百分比 。 注 意 到 这 是 一 个 非常 广义 的 信任 度 ; 事 
X b. KAP u 在 对 某 些 特定 物品 进行 推荐 中 完成 的 比较 好 时 ， 这 是 经 常 发 生 的 。 为 了 实 
现 这 个 目标 O' Donovan 也 提出 了 更 多 细 粒 度 的 物品 级 的 信任 世 ， 这 个 度量 表示 物品 i 被 正 
确 推荐 的 百分比 。 因 此 ， 在 这 种 自动 方式 下 ， 信 任 值 不 是 通过 传播 和 聚合 生成 的 ， 而 是 基 
于 过 去 的 评分 。 注 意 到 O’ Donovan 的 方法 是 全 局 信任 度 。 值 获得 的 方式 可 以 被 认为 是 概 
率 的 。 

基于 信任 的 过 滤 “与 别 的 信任 增强 技术 相似 ， 通 过 信任 度量 获得 的 值 可 以 在 推荐 过 程 
中 作为 权重 。 像 Massa — FÉ, O' Donovan 等 的 方法 集中 于 协同 过 滤 中 加 入 信任 。 文 献 
[46j 中 做 出 了 几 种 尝试 。 如 把 PCC 信息 和 获得 的 信任 值 合并 ， 这 种 方式 的 一 个 替代 方式 
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是 使 用 信任 值 作 为 过 滤器 ， 这 样 在 推荐 过 程 中 只 有 最 值得 信任 的 邻居 参与 进来 。 这 种 策略 
被 叫 作 基于 信任 的 过 滤 ， 见 式 (20. 5) wau PCC, RT* —RT(]R* 


Pai = 7, +2 (20. 5) 
u€R 

AX, B mAP SUE tERmTdIUSEBIBJFHS5aRRPIERXIBMIBSBSPqZU 
考虑 。 

在 文献 L46j 中 ，O'Donovan 和 Smyth 展示 了 基于 信任 的 过 滤 方 法 比 协同 过 滤 在 平均 
错误 率 上 取得 更 好 的 结果 。 而 且 ， 在 几乎 70% 的 预测 实例 上 ， 基 于 用 户 级 别 信任 的 算法 比 
协同 过 滤 方 法 产生 更 少 的 错误 。 

在 自动 生成 信任 的 方法 中 ，0O’ Donovan 的 方法 是 一 个 代表 性 例子 。 可 以 在 文献 [30j 中 
找到 一 个 相似 的 方法 ， 用 一 个 实用 度量 方法 来 代替 一 个 二 值 正确 性 函数 。 


20. 3.3 实验 比较 


那么 在 实际 应 用 中 ， 上 面 讨论 的 哪 一 种 方法 是 最 佳 的 呢 ? 目前 为 止 ， 基 于 信任 的 推荐 
领域 中 的 研究 者 都 是 使 用 自己 的 数据 集 和 应 用 来 介绍 和 评估 他 们 提出 的 新 算法 ， 而 没有 在 
同一 个 数据 集 或 者 应 用 中 与 其 他 的 信任 增强 算法 作 比 较 。 因 此 ， 本 节 接 下 来 将 在 同一 个 数 
据 集 上 对 前 面 提 到 的 几 种 信任 增强 算法 进行 性 能 上 的 比较 。 我 们 将 集中 比较 Golbeck 的 基 
于 信任 的 加 权 平 均 算法 TidalTrust, Massa 的 基于 信任 的 协同 过 滤 算 法 MoleTrust. 和 O' 
Donovan 的 基于 信任 的 过 滤 算 法 ( 式 (20. 5)) 。 由 于 我 们 的 目的 是 比较 在 同一 数据 集中 的 三 
种 算法 ， 为 了 研究 信任 传播 的 影响 ， 我 们 没有 选择 完成 O' Donovan 的 自动 信任 生成 策略 ， 
而 是 挖掘 同样 的 信任 网 络 作为 另外 的 两 种 策略 。 尽 管 O'Donovan 等 没有 在 他 们 的 实例 中 
使 用 信任 传播 算 子 ， 这 样 做 当然 是 可 能 的 。 由 于 在 式 (20. 5) 中 没有 明确 使 用 信任 值 ， 我 们 
只 需要 指出 信任 传播 是 如 何 扩大 R W. 
20. 3. 3. 1 数据 集 

我 们 的 实验 中 使 用 的 数据 集 来 自 Epionions. Com。 该 网 站 中 用 户 对 消费 的 物品 进行 评 
论 并 对 物品 和 评论 进行 评分 。 在 信任 增强 推荐 系统 实验 中 常用 两 个 Epionions 数据 集 。 第 
一 个 数据 集 是 Massa 和 Bhattacharje[39] 用 了 5 个 星期 的 候 虫 收集 到 的 ， 包含 49290 个 用 
户 ，139738 个 物品 。 评 分 范围 为 1 一 5。 第 二 个 数据 集 是 由 Guha 等 [21] 收 集 的 : 这 个 数据 
集 包 含 163634 个 用 户 ，1560144 条 评论 ，25170637 个 评分 。 对 评论 的 评分 范围 从 “没有 帮 
Bj OL 分 )” 到 “最 大 帮助 (5 分 )”。 这 个 数据 集 不 包含 关于 物品 和 物品 评分 的 任何 信息 ， 而 是 
用 评论 和 评论 评分 代替 了 。 换 句 话 说， 这 个 数据 集 是 对 评论 推荐 系统 进行 讨论 和 评估 。 因 
此 ， 在 与 Guha 相关 的 数据 集中 ， 一 个 物品 表示 对 一 个 消费 商品 的 评论 ， 而 对 扑 虫 数据 集 ， 
一 个 物品 表示 一 个 消费 商品 。 l 

对 于 随机 的 和 那些 有 争议 的 物品 ， 我 们 的 实验 关注 系统 生成 的 推荐 /预测 的 数量 以 及 
预测 的 错误 率 。 那 些 有 争议 的 物品 是 对 于 推荐 系统 最 有 挑战 的 物品 ， 因 为 如 果 一 个 物品 获 
得 的 分 数 差异 很 大 ， 那 么 反映 了 对 该 物品 的 意见 不 一 致 。 更 多 的 情况 是 ， 若 目标 商品 是 有 
争议 的 ， 例 如 ， 当 一 个 商品 拥有 数目 相当 的 热心 支持 者 和 积极 的 反对 者 ， 那 么 被 推荐 的 物 
品 需 要 真正 的 个 性 化 。 在 文献 [63] 中 Victor 等 解释 了 为 什么 用 经 典 的 标准 差 方 法 来 表示 数 
据 集 中 有 争议 的 物品 是 不 够 的 ， 并 且 提 出 一 个 新 的 度量 来 表示 一 个 物品 的 争议 程度 。 他 们 
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的 方法 分 别 在 Guha 和 Massa 的 数据 集中 找到 了 1416 和 266 个 争议 物品 。 关 于 争议 性 的 
计算 ， 更 多 细节 可 参见 文献 [63]。 为 了 对 比 在 争议 的 物品 (CD 和 一 般 商 品 上 的 性 能 ， 我 们 
分 别 在 两 个 数据 集中 随机 选择 1416 个 和 266 个 畅销 物品 (RI， 类 似 争议 商品 ， 至 少 被 评估 
过 20 次 )， 其 中 也 展示 了 不 同方 法 在 平均 覆盖 率 和 准确 度 上 的 结果 。 

Epinions 允许 用 户 针 对 其 他 用 户 的 评论 质量 对 用 户 打分 。 这 样 不 仅 可 以 评分 ， 还 可 以 
进行 信任 和 不 信任 评估 。 事 实 上 两 个 数据 集 都 包含 了 来 自用 户 的 明确 信任 信息 ， 这 使 得 这 
两 个 数据 集 非 常 适合 信任 增强 推荐 系统 的 研究 。 用 户 可 以 评估 其 他 用 户 ， 以 确定 把 他 们 放 
xt WOT( 即 评论 和 评分 都 被 发 现 是 有 价值 的 评论 者 列表 9 ) 或 者 不 信任 列表 (评论 被 发 现 是 
攻击 性 、 不 准确 或 低 质量 ， 也 就 是 不 可 信 的 作者 列表 ) 。 在 Guha 的 数据 集中 ，Epinions 信 
任 图 由 114222 个 用 户 和 717 129 个 信任 关系 (不 包含 自己 信任 ) 构 成 。Massa 的 数据 集 由 49 
288 个 用 户 以 及 487 003 个 信任 评价 构成 。 

由 于 数据 集 只 包含 二 值 信任 ， 所 以 在 我 们 的 实验 中 ， 式 (20. 1)、 式 (20.4) 和 式 (20. 5) 
的 ts 中 只 考虑 值 0( 完 全 不 信任 ) 和 1( 完 全 信任 ) 。 这 个 限制 导致 了 一 些 基 于 信任 算法 的 改 
变 ， 如 式 (20. 1) 简 化 成 了 平均 。 为 了 简单 ， 我 们 在 这 篇 论文 中 只 考虑 一 步 传 播 。 这 意味 着 
式 (20. 4) 和 式 (20. 5) 中 ， 我 们 只 考虑 长 度 为 1 和 2 的 传播 链 ， 而 在 式 (20. 2) 中 由 于 不 能 得 
到 更 短 的 传播 链 ， 我 们 只 考虑 长 度 为 2 的 传播 链 。 这 两 步 简化 限制 了 我 们 的 实验 比较 ， 因 
为 我 们 不 能 完全 按照 设计 的 算法 对 它们 进行 对 比分 析 。 
20.3.3.2 覆盖 率 


覆盖 率 是 指 由 预测 产生 的 用 户 一 物品 配对 数 。 一 个 传统 的 评价 推荐 系统 覆盖 率 的 方法 
是 留 一 法 ， 即 隐藏 一 个 评分 然后 预测 这 个 隐藏 值 。 覆 盖 率 的 算法 是 通过 p,; 除 以 留 一 法 产 
生 的 数目 来 实现 的 ( 即 数据 集中 有 效 的 评分 数 ) 。 式 (20. 3) 中 ， 我 们 称 p。,; 是 可 计算 的 ， 因 
为 至 少 有 一 个 用 户 可 以 被 计算 ， 而 在 式 (20. 1) 和 式 (20.4) 中 ， 思 ;表示 至 少 有 一 个 用 户 z 
的 ,是 可 计算 的 。 最后， 式 (20. 5) 中 ， 若 至 少 有 一 个 用 户 x 的 PCC 可 计算 和 z= 二 1， 则 
是 可 预测 的 。 

K 20.3 显示 了 Guha 和 Massa 数据 集中 的 争议 物品 (CI) 和 随机 选择 物品 (RI) 的 覆盖 
率 。 前 四 行 包含 四 个 基准 策略 (Bl1)-(B4)。 第 一 个 基准 策略 Bl 是 推荐 系统 总 是 做 出 5 分 
(总 分 5 分 ) 的 预测 ， 而 5 分 是 Epinions 上 物品 最 频繁 的 得 分 。 第 二 个 基准 策略 使 用 物品 的 
平均 得 分 (B2)， 第 三 个 基准 策略 使 用 用 户 的 平均 得 分 (B3)。 后 者 使 用 那些 评分 差异 度 小 
的 用 户 的 评分 。 第 四 个 基准 策略 返回 一 个 1—5 随机 分 (B4) 。 

总 的 来 说 ， 策 略 B1、B2、B4 对 有 争议 的 和 随机 选 定 的 物品 都 获得 了 100% 覆 盖 率 ， 
Bl 和 B4 没有 使 用 别 的 附加 信任 信息 ， 因 为 我 们 的 实验 中 ， 这 些 物品 至 少 被 评分 20 次 ， 
所 以 B2 总 是 可 以 计算 的 。 而 B3 在 那些 用 户 只 对 一 个 物品 打分 的 情况 下 ， 不 能 产生 平均 评 
分 ， 因 此 不 能 产生 预测 。 

对 表 20. 3 中 的 其 他 算法 ， 第 一 列表 示 上 文 给 出 的 推荐 公式 。 信 任 增强 算法 中 ， 我 们 
分 别 使 用 了 传播 信任 信息 的 (上 面 几 行 ) 和 未 使 用 传播 信任 信息 的 (下 面 几 行 ) 实 验 。 我 们 只 
考虑 一 步 传 播 : P1 和 P4， 我 们 分 别 使 用 了 TidalTrust 和 ModelTrust 9 中 的 传播 策略 。 而 
在 P5 中 ， 如 果 一 个 用 户 属 于 用 户 a 的 信任 网 络 或 者 被 用 户 a 的 信任 网 络 的 成 员 信 任 ， 则 
我 们 把 该 用 户 包 含 进 RT. 


© www.epinions. com/help/faq/ 
日 ”注意 ， 我们 包含 了 Massa 等 针对 二 元 信任 环境 的 基于 水 平 的 策略 [35] 。 
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表 20.3 基于 信任 的 推荐 算法 性 能 比较 
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如 果 没 有 信任 传播 ， 与 其 他 算法 相 比 ， 协 同 过 滤 算 法 的 覆盖 率 无 疑 是 最 好 的 。 这 是 由 
于 通常 PCC 信息 比 直接 的 信任 信息 更 容易 得 到 : AP a 有 正 相 关 的 用 户 比 a 信任 网 络 中 
的 用 户 更 多 。 另 一 方面 ,使 用 了 PCC 权 加 权 的 基于 信任 的 过 滤 式 (20.5) 算 法 是 最 苛刻 的 
策略 ， 因 为 它 要 求 用 户 a 的 信任 网 络 中 的 用 户 和 a 一 样 对 其 他 物品 打 过 二 次 分 (否则 PCC 
就 不 能 被 计算 ) 。TidalTrust 式 (20. 1) 的 覆盖 率 比 ModelTrust 式 (20. 4) 的 覆盖 率 高 一 点 ， 
这 是 由 于 后 者 只 能 对 那些 至 少 对 两 个 物品 打 过 分 的 用 户 生成 推荐 预测 (否则 用 户 的 平均 得 
分 就 不 能 被 计算 )。 

当 加 入 信任 传递 后 ， 这 些 方法 依据 覆盖 率 排序 的 顺序 依然 保持 不 变 。 但 是 值得 注意 的 
是 ， 协 同 过 滤 方 法 由 于 考虑 了 传播 ， 在 Guha 数据 集中 对 于 争议 和 随机 选择 物品 ， 覆 盖 率 
分 别 增加 了 2596580 10%, ME Massa 的 数据 集中 超过 了 30%. 

Guha 的 数据 集中 争议 物品 覆盖 率 显 著 低 于 随机 选择 物品 。 这 是 由 于 该 数据 集中 争议 
物品 比 随 机 选择 物品 较 少 获得 评分 机 会 ， 这 导致 这 些 物 品 不 仅 在 留 一 法 中 较 少 ， 而 且 较 少 
机 会 获得 一 个 拥有 正面 PCC 的 用 户 评分 信任 值 。 这 也 解释 了 复杂 的 推荐 策略 具有 较 低 的 
推荐 率 。 而 Massa 的 数据 集中 就 得 不 到 类 似 的 结果 ，CI 比 RI 获得 了 更 多 的 评分 (21 131: 
12 741)。 这 解释 了 随机 选择 物品 集 数 据 集 算法 性 能 在 覆盖 率 中 有 点 差 的 结果 。 

这 也 意味 着 Massa 的 数据 集 的 覆盖 率 要 显著 低 于 Guha 的 数据 集 。 式 (20.1)、 式 
(20. 4)、 式 (20. 5) 获 得 的 覆盖 率 至 少 要 低 20%。 相 对 于 Massa 数据 集 而 言 ，Guha 数据 集 
中 用 户 给 更 多 的 物品 评分 ， 这 就 导致 给 同一 个 物品 评分 的 用 户 更 少 ， 即 邻居 用 户 更 少 。 
20.3.3.3 准确 率 

推荐 系统 的 准确 率 通常 根据 留 一 法 进行 评价 ， 更 多 的 是 由 隐藏 评分 和 预测 评分 的 差 来 
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决定 的 。 我 们 使 用 常用 的 两 个 度量 指标 : 平均 绝对 误差 (MAE) 和 平均 平方 根 误差 
(RMAE)[22]。 前 者 同样 对 待 每 一 个 误差 而 后 者 强调 较 大 的 误差 。 由 于 评论 和 物品 的 评分 
同样 都 采用 5 分 对 待 每 一 个 误差 值 。MAE 和 RMSE 中 的 极 差 可 以 达到 0 和 4。RMSE 的 
一 个 细微 的 改进 在 推荐 系统 中 都 是 非常 有 价值 的 。 如 NetFlix 竞赛 ?主办 方 提供 了 100 万 
美元 给 RMSE 减低 了 10% 的 获胜 者 。 

表 20. 3 中 争议 物品 的 MAE 和 RMSE 都 比 随机 选择 物品 要 高 。 也 就 是 说 ， 相 对 于 随 
机 选择 物品 ， 争 议 物品 产生 更 好 的 推荐 结果 更 难 。 这 个 结论 对 于 所 有 的 算法 都 适用 ， 但 是 
基准 策略 的 几 个 算法 更 明显 地 体现 出 来 (除了 B4)。 然 而 在 Massa 数据 集中 ， 所 有 的 算法 
变化 趋势 都 差不多 ， 在 Guha 数据 集中 Bl 和 B2 要 对 争议 物品 产生 预测 更 困难 : 而 对 于 随 
机 选择 物品 ， 它 们 可 以 和 协同 过 滤 和 基于 信任 算法 相 媲 美 。 在 争议 物品 集中 ， 它 们 的 
MAE 和 RMSE 增加 了 1 分 。 

同时 也 需 注意 ， 不 管 是 争议 物品 还 是 随机 物品 ， 在 Massa 中 产生 好 的 推荐 比 Guha 中 
更 难 。 这 是 由 于 Massa 数据 集中 物品 自身 就 具有 更 多 争议 性 。 

我 们 注意 到 ， 不 考虑 传播 性 ， 使 用 非 基准 线 中 方法 计算 争议 物品 的 MA 时 ， 信 任 增强 
方法 都 比 协同 过 滤 产 生 更 好 的 结果 (在 Massa 数据 集中 使 用 基于 信任 的 协同 过 滤 时 只 有 
一 个 例外 ) ， 这 与 文献 [15，36] 中 的 结果 是 一 致 的 。 这 可 以 归结 到 准确 率 和 覆盖 率 的 关系 ， 
覆盖 率 增 强 意味 着 准确 率 下 降 ， 反 之 亦 然 。 很 显然 当 考虑 了 信任 传播 算 子 的 时 候 ， 信 任 增 
强 算法 与 协同 过 滤 算 法 的 覆盖 率 很 接近 。MAE 也 是 这 样 。 

而 RMSE 却 并 不 如 此 。 在 争议 物品 集中 ， 信 任 增强 算法 的 RMSE 通常 比 协同 过 滤 算法 
要 高 ， 而 在 随机 物品 集中 却 不 一 定 ? 较 高 的 RMSE 意味 着 较 大 的 预测 误差 。 对 争议 物品 而 
言 ， 这 可 能 是 由 于 RT 集 中 对 指定 物品 的 打分 人 数 太 少 (如 只 有 一 个 用 户 )， 特 别 是 比 R E 
小 。 这 个 假设 也 被 如 下 事实 支持 : 由 于 信任 传播 网 络 中 RMSE 的 增强 比 MAE 慢 。 另 外 ， 传 
” 播 算法 经 常 比 对 应 的 非 传播 算法 获得 更 低 的 RMSE， 参 见 Massa 数据 集中 的 争议 物品 结果 。 
20.3.3.4 结论 E 


实验 中 的 两 个 Epinions 数据 集 都 有 各 自 的 特点 ， 却 都 获得 了 相同 的 结论 。 对 随机 物 
品 ， 智 能 推荐 策略 (如 协同 过 滤 、 基 于 信任 的 算法 ) 和 基线 方法 表现 差不多 。 而 对 争议 物 
品 ， 智 能 推荐 算法 表现 要 好 得 多 。 尽 管 还 有 提升 性 能 的 余地 ， 但 是 信任 增强 推荐 系统 相对 
其 他 方法 没有 明显 的 优势 ， 较 高 的 RMSE 值 以 及 在 Massa 数据 集 的 CI 上 ， 基 于 信任 的 方 
法 并 不 会 产生 比 协 同 过 滤 更 好 的 结果 都 是 事实 。 这 些 发 现 要 求 在 改进 算法 和 信任 算法 有 效 
性 的 适应 性 方面 有 更 深 的 研究 (例如 ， 对 于 冷 启 动用 户 Massa 等 的 结果 是 什么 ) 。 

通过 和 覆盖 率 和 精确 率 对 三 种 最 佳 信任 增强 策略 (分 别 由 Golbeck 等 、Massa %, O'Do- 
novan 等 提出 ) 进 行 评估 的 结果 没有 显示 哪 种 策略 具有 明显 的 优势 。 基 于 信任 的 协同 过 滤 
策略 在 Massa 的 数据 集 上 得 分 最 高 ， 而 基于 信任 的 加 权 平 均 和 基于 信任 的 过 滤 在 Guha 的 
数据 集 上 精确 度 最 高 。 根 据 信 任 传 播 获得 的 结果 也 类 似 。 

由 于 这 两 个 数据 集 包 含 了 评分 信息 和 信任 信息 ， 它 们 在 信任 增强 推荐 测试 中 很 常用 。 
然而 ， 这 两 个 数据 集 有 一 个 缺点 : 在 Epinions 数据 集中 的 信任 值 是 二 值 的 。 由 于 许多 现 有 
的 信任 方法 都 是 基于 信任 值 是 连续 的 假设 之 下 ， 这 使 得 我 们 要 想 探讨 本 章 讨论 的 各 种 算法 
是 不 行 的。 遗憾 的 是 ， 目 前 还 没有 公开 的 信任 值 是 连续 值 的 数据 集 。 


© http://www. netflixprize. com/ 


© 注意 ， 所 有 在 Guha 数据 集 上 的 MAE 提升 在 统计 上 都 是 显著 的 (p 二 0. 000), 
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20.4 进展 和 开放 性 挑战 


在 前 面 几 节 ， 我 们 介绍 了 信任 建 模 、 信 任 度量 、 信 任 增强 推荐 系统 的 基础 知识 。 本 节 
我 们 想 给 读者 提出 在 基于 信任 的 推荐 系统 领域 中 未 来 可 能 的 新 的 研究 方向 。 这 并 不 意味 着 
是 一 个 全 面 的 介绍 ， 而 只 是 有 选择 地 介绍 该 领域 的 一 些 进 展 。 我 们 将 特别 简短 地 讨论 以 下 
问题 : 缓解 基于 信任 的 冷 启动 ， 信 任 增强 推进 系统 的 可 视 化 ， 基 于 信任 研究 的 理论 基础 ， 
把 不 信任 引入 推荐 过 程 。 

Massa 和 Avesani 的 研究 显示 通过 在 推荐 系统 中 引入 用 户 信 任 网 络 能 有 效 缓 解 常 碰 到 
的 冷 启动 问题 。 他 们 证 明了 对 一 个 新 用 户 提 出 一 些 信任 问题 让 其 回答 (与 对 物品 评分 比 
较 )， 对 于 其 在 系统 中 获得 一 个 好 的 推荐 是 非常 有 好 处 的 [35]。 然 而 ，Victor 等 研究 显示 
通常 是 冷 启动 的 用 户 ( 仅 对 很 少 一 部 分 物品 评分 ) 在 信任 网 络 中 也 是 冷 启动 用 户 [61]。 因 
此 ， 一 定 要 鼓励 新 用 户 和 别 的 用 户 建立 联系 来 尽 可 能 地 拓展 信任 网 络 ， 但 是 选择 谁 来 建立 
联系 经 常 是 一 个 难题 。 在 业已 交付 的 推荐 中 ， 指 导 这 些 新 来 者 如 何在 早期 阶段 中 建立 联系 
是 非常 重要 的 。 在 文献 L61] 中 ， 这 个 问题 是 通过 推荐 系统 网 络 中 的 三 种 关键 角色 来 解决 
的 : 资深 评分 用 户 、 专 家 、 连 接 者 。 作 者 指出 ， 对 一 个 冷 启 动用 户 ， 连 接 到 一 个 标志 性 的 
关键 人 物 比 随机 选择 一 个 用 户 在 推荐 系统 中 的 覆盖 率 和 精确 率 上 都 更 具 优势 。 

注意 到 这 个 连接 引导 问题 牵扯 到 更 广泛 的 信任 引导 问题 ， 即 如 何在 网 络 中 建立 一 个 初 
始 信任 关系 的 问题 。O'Donovan 用 了 一 种 非常 特别 的 方法 也 解决 这 一 冷 启动 问题 ， 他 的 方 
法 叫 PeerChooser， 这 是 一 个 新 的 对 基于 信任 的 协同 过 滤 系 统 进行 可 视 化 的 程序 。 具 体 来 
说 ，PeerChooser 不 仅 能 够 对 来 自传 统 的 相似 度 方法 PCC 的 信息 进行 可 视 化 ， 而 且 可 以 对 
由 评分 数据 (我 们 前 文 提 到 了 O' Donovan 在 [46] 中 提出 的 信息 和 物品 数据 ) 生 成 的 信任 空 
间 信 息 进 行 可 视 化 。 这 个 软件 的 主要 特点 之 一 是 ， 它 在 推荐 时 能 够 从 用 户 那 里 获得 信任 信 
息 ， 这 是 通过 在 交互 界面 上 通过 移动 用 户 图 标 来 实现 的 。 这 样 用 户 不 仅 可 以 表达 他 们 的 情 
绪 和 喜好 等 ， 而 且 更 愿意 主动 。 

当 用 户 间 信任 关系 不 能 明确 给 出 的 时 候 ， 也 有 一 些 其 他 的 方法 来 建立 信任 关系 。 社 交 
数据 是 可 以 作为 参考 信息 来 源 的 ， 如 在 线 社交 和 商业 往来 (如 Facebook 和 LinkedIn), 
Email 通信 、 信 誉 系统 等 。 在 推荐 系统 的 研究 中 ， 这 些 数据 源 都 是 作为 信任 关系 来 讨论 
的 ， 尽 管 他 们 对 应 不 同 的 概念 : 行为 学 理论 区 分 成 了 同 质 性 与 认 知 相似 性 ， 社 交 资 本 ( 信 
誉 、 意 见 领 袖 等 )、 紧 密 程度 (关系 持续 时 间 、 互 动 频率 ) 和 信任 [40，41]。 这 些 社交 数据 
源 可 以 用 于 (信任 增强 ) 推 荐 系统 ， 但 是 研究 并 未 指出 到 底 哪 种 数据 源 是 最 有 用 的 [4]。 是 
否 这 些 数 据 源 都 可 能 会 像 本 章 讨论 的 经 典 的 基于 信任 的 推荐 系统 一 样 提供 类 似 的 结果 。 在 
文献 [5] 中 ，Arazy 等 提出 这 个 问题 ， 并 争论 称 社交 推荐 系统 的 设计 应 该 基于 某 种 理论 ， 
而 不 应 该 为 了 某 种 目的 而 特别 设计 ， 尽 管 当 前 的 算法 经 常 采用 这 样 的 设计 方式 。 

另 一 个 近来 的 一 个 研究 方向 是 基于 信任 推荐 系统 中 的 另 一 个 属性 ， 即 不 信任 。 事 实 上 ， 
在 信任 建 模 领域 中 很 少 有 关于 不 信任 的 研究 ， 在 推荐 领域 中 则 更 少 。 这 是 几 方 面 的 原因 造成 
的 ， 最 重要 的 原因 是 很 少 能 得 到 不 信任 信息 的 数据 源 ， 另 外 人 们 也 不 知道 不 信任 如 何 传播 ， 
在 推荐 中 如 何 使 用 它 形 成 一 致意 见 。 文 献 L64] 第 一 次 在 推荐 过 程 中 对 使 用 不 信任 进行 了 实验 
评价 。 一 共 研 究 了 三 种 不 信任 策略 ， 第 一 种 把 不 信任 作为 逆向 偏差 指示 器 ， 而 第 二 种 把 不 信 
任用 来 过 波 邻 居 用 户 ， 第 三 种 把 不 信任 作为 信任 网 络 的 调试 器 。 前 两 种 策略 是 基于 在 协同 过 . 
滤 系 统 中 信任 可 以 用 于 选择 相似 用 户 ( 近 邻 ) 的 原理 ， 后 者 是 该 领域 中 的 不 同 研 究 者 提出 来 的 
[20，68]。 结 果 显 示 第 一 种 策略 不 值得 考虑 ， 而 用 不 信任 去 过 滤 或 者 调试 看 起 来 更 有 希望。 
但 是 很 显然 ， 在 得 到 更 精确 的 结果 之 前 ， 这 个 新 生 的 研究 领域 还 有 很 多 工作 要 做 。 
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20.5 总 结 


本 章 对 信任 建 模 领域 的 研究 做 了 介绍 ， 阅 述 了 信任 网 络 是 如 何 增强 传统 推荐 系统 性 能 
的 。 我 们 讨论 了 几 种 效果 最 好 的 信任 增强 推荐 策略 ， 并 利用 Epinions. com 中 的 两 个 数据 
集 做 实验 来 测试 这 几 种 方法 的 性 能 。 根 据 覆 盖 率 和 准确 率 并 不 能 明确 区 分 哪 种 算法 具有 明 
显 的 优势 ， 但 是 也 显示 每 种 算法 都 有 自己 的 优点 。 

拥有 用 户 信任 网 络 的 推荐 系统 可 以 利用 信任 聚合 策略 来 增强 推荐 性 能 。 而 在 那些 没有 
确切 信任 关系 的 推荐 系统 中 ， 能 够 自动 计算 信任 度 的 方法 目前 来 看 是 最 理想 的 解决 方案 。 
当然 ， 如 果 没 有 适合 的 数据 集 或 者 应 用 来 测试 ， 这 些 策 略 也 不 会 被 创造 出 来 。 

事实 上 ， 缺 乏 公 开 有 效 适 用 的 测试 数据 集 是 信任 增强 推荐 系统 研究 面临 的 最 大 困难 之 
一 。 所 以 我 们 希望 在 不 久 的 将 来 每 一 个 这 个 领域 的 研究 员 都 可 以 获得 更 多 这 样 的 数据 和 应 
用 。 我 们 也 有 足够 的 信心 相信 这 个 领域 将 吸引 越 来 越 多 的 研究 者 ， 并 且 促 进 基 于 信任 推荐 
系统 研究 领域 的 蓬勃 发 展 。 
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摘要 本 章 将 介绍 如 何 通过 聚合 单个 用 户 模型 的 信息 和 建立 用 户 情感 状态 模型 来 完成 
面向 用 户 组 的 推荐 系统 ， 并 总 结 了 该 领域 过 去 的 研究 成 果 。 本 章 还 介绍 了 群 组 推荐 技术 在 
单个 用 户 推 荐 上 的 应 用 ， 特 别 是 在 解决 冷 启动 (cold-start) 问 题 和 处 理 多 重 准则 上 的 应 用 。 


21.1 简介 


到 目前 为 止 ， 推 荐 系统 相关 的 大 多 数 工 作 关注 如 何 向 单个 用 户 推 荐 商品 。 例 如 ， 基 于 
用 户 以 前 行为 的 偏好 模型 ， 为 某 个 特定 用 户 挑选 一 本 书 。 推 荐 系统 设计 者 通常 面临 的 挑战 
是 如 何 为 单个 用 户 决策 出 最 佳 物品 。 在 这 方面 已 经 有 很 多 的 研究 成 果 ， 书 中 其 他 章节 
(第 2—6 章 ) 已 经 说 明 。 
本 章 我 们 将 进一步 深入 研究 。 在 很 多 情况 下 ， 向 群 组 用 户 推荐 的 效果 可 能 优 于 向 单个 
用 户 推荐 的 效果 。 例 如 ， 推 荐 系统 可 以 根据 所 有 群 组 成 员 的 喜好 进行 建 模 ， 来 为 群 组 选择 
要 看 的 电视 节目 或 要 听 的 一 系列 歌曲 。 面 向 群 组 的 推荐 甚至 比 面向 单个 的 更 加 复杂 ， 设 想 
我 们 明确 地 知道 单个 用 户 的 喜好 ， 那 么 问题 上 升 为 如 何 整合 所 有 单个 用 户 的 喜好 来 建立 模 
型 。 在 本 章 中 我 们 将 讨论 群 组 推荐 是 如 何 工作 的 ， 面 临 哪些 困难 ， 以 及 已 经 取得 了 哪些 成 
果 。 更 加 有 趣 的 是 ， 我 们 还 将 给 大 家 展示 群 组 推荐 在 单个 用 户 推荐 上 的 一 些 应 用 。 因 此 ， 
即使 你 正在 开发 的 推荐 系统 是 面向 单个 用 户 的 ， 你 仍然 会 乐于 阅读 本 章 ( 可 能 首先 阅读 
21.7 节 会 更 加 使 你 信服 这 一 点 )。 
本 章 关注 的 重点 是 判断 将 何 物 推荐 给 群 组 用 户 ， 特 别 是 如 何 整 合 单个 用 户 模 型 。 当 建 
立 一 个 群 组 推荐 系统 时 ， 还 有 一 些 超 出 本 章 范围 之 外 的 事情 需要 考虑 。 特 别 是 如 下 几 点 : 
。 如 何 获得 单个 用 户 的 偏好 信息 。 可 以 使 用 一 些 常 用 的 推荐 系统 技术 (如 显 式 的 评 
分 ， 基 于 内 容 的 协同 过 滤 方 法 ， 见 本 书 其 他 章节 )。 这 里 有 一 个 困难 就 是 ， 当 群 组 
用 户 使 用 这 个 系统 时 你 很 难 推断 出 某 个 个 体 的 喜好 ， 但 是 在 个 体 间 一 起 使 用 联合 
概率 模型 可 推断 出 个 体 喜 好 。 另 外 一 个 困难 就 是 单个 用 户 的 评分 依赖 于 他 所 在 的 
群 组 。 例 如 ， 一 个 少年 可 能 喜欢 与 他 的 弟弟 妹妹 一 起 观看 某 个 节目 ， 却 不 想 和 他 
的 朋友 一 起 观看 。 
。 系统 如 何 知道 当前 使 用 对 象 是 谁 ? 有 不 同 的 解决 办 法 ， 例 如 ， 用 户 明确 的 登录 、 
概率 机 制 ， 利 用 时 间 预 测 当 前 对 象 ， 或 利用 符号 和 标签 等 L[10] 。 
。 如 何 推出 和 解释 群 组 推荐 结果 ? 从 相关 章节 可 以 看 出 ， 仅 对 单个 用 户 进 行 推荐 和 
解释 推荐 就 已 经 存在 很 多 困难 ， 群 组 推荐 的 情况 甚至 更 加 困难 ， 关 于 群 组 推荐 的 
解释 在 文献 [8] 中 和 21. 8 节 有 进一步 的 讨论 。 
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。 如 何 帮 助 用 户 做 出 最 终 的 决定 ? 在 一 些 群 组 推荐 实例 中 ， 提 供给 用 户 的 是 群 组 推 
荐 ， 用 户 基于 这 些 推荐 结果 来 决定 接 下 来 该 做 什么 ， 而 在 另外 一 些 群 组 推荐 中 不 
存在 这 个 问题 ( 见 21. 2. 3 节 介绍 了 积极 和 被 动 的 群 组 的 不 同 )。 文 献 [8] 中 简要 描 
述 了 哪些 情况 下 可 以 为 用 户 的 决策 提供 帮助 。 
下 一 节 将 重点 介绍 群 组 推荐 的 使 用 场景 ， 并 根据 不 同 的 使 用 场景 提供 一 种 基于 分 类 方 
法 的 群 组 推荐 。21. 3 节 讨 论 了 整合 单个 用 户 模型 用 于 群 组 推荐 的 策略 ， 并 介绍 哪些 策略 
已 经 应 用 于 当前 系统 和 我 们 能 够 从 过 去 的 经 验 中 学 习 到 什么 。21. 4 节 解 决 为 用 户 推荐 一 
系列 物品 时 的 排序 问题 。21. 5 节 介 绍 情感 状态 模型 ， 包 括 单个 用 户 的 情感 状态 如 何 被 组 
内 其 他 成 员 的 情感 状态 所 影响 。21. 6 节 探 讨 如 何 通过 情感 模型 来 建立 更 加 复杂 的 整合 策 
略 。21.7 节 介绍 了 群 组 模型 和 群 组 推荐 技术 如 何 应 用 于 单个 推荐 上 。21. 8 节 对 本 章 进 行 
了 总 结 并 讨论 了 将 来 所 面临 的 挑战 。 


21.2 应 用 场景 和 群 组 推荐 系统 分 类 


在 很 多 环境 下 ,我 们 需要 适应 一 个 群 组 的 需求 而 不 是 单个 用 户 的 需求 。 下 面 ， 我们 将 
提供 两 个 场景 为 我 们 在 该 领域 的 工作 提供 灵感 ， 讨 论 场景 背后 的 相关 工作 ， 提 供 一 种 组 推 
荐 系统 的 分 类 方法 ,该 方法 的 灵感 来 自 使 用 场景 的 不 同 。 


21.2.1 交互 式 电视 


交互 式 电 视 使 个 性 化 的 观赏 体验 成 为 可 能 ， 抛 弃 所 有 人 都 看 同一 个 新 闻 节 目的 传统 模 
式 ， 取 而 代 之 的 是 为 观众 提供 个 性 化 的 节目 。 例 如 ， 对 于 我 来 说 ， 可 能 希望 看 更 多 的 有 关 
新 西 兰 (我 的 家 乡 )、 中 国 ( 多 次 在 那里 度假 后 令 我 着 迷 的 国家 ) 和 足球 的 报道 ， 而 去 掉 关 于 
板 球 ( 一 个 我 无 法 理解 的 运动 项 目 ) 和 当地 犯罪 的 报道 。 类 似 地 ， 音 乐 节目 可 以 选择 一 些 我 
非常 喜欢 的 音乐 剪辑 呈现 给 我 。 

在 传统 的 推荐 系统 (如 电脑 软件 ) 和 交互 式 电视 (如 上 面 所 简 述 的 场景 ) 之 间 存 在 两 点 主 
要 的 不 同 。 首 先 ， 与 使 用 个 人 电脑 相 比 ， 观 看 电视 的 大 多 数 时 候 是 一 个 家 庭 或 者 社会 团 
体 。 所 以 ,电视 新 闻 必须 适应 当前 坐 在 它 前 面 的 一 群 人 ， 而 不 是 个 别 观众 。 第 二 ， 传 统 的 
推荐 技术 通常 考虑 的 是 向 用 户 推 荐 一 个 特别 的 东西 ， 例 如 ， 一 部 用 户 可 能 会 观看 的 电影 ， 
而 在 上 面 所 述 的 场景 中 ， 电 视 需 要 选择 一 系列 的 节目 (如 新 闻 特 辑 、 音 乐 剪辑 ) 给 观众 。 将 
面向 群 组 的 推荐 技术 和 推荐 一 系列 物品 结合 是 一 件 非常 有 趣 的 工作 ， 因 为 为 了 使 组 中 所 有 
的 单个 用 户 都 喜欢 ， 对 于 推荐 序列 中 某 个 特定 用 户 不 喜欢 的 物品 ， 可 能 会 允许 你 用 序列 中 
其 他 一 些 他 们 喜欢 的 物品 来 进行 补偿 。 


21.2.2 环绕 智能 


环绕 智能 对 于 设 定 的 屋 里 环境 可 以 感知 在 场 的 人 并 做 出 反应 。 例 如 ， 假 设 这 样 一 个 书 
店 ， 它 里 面 的 检测 器 可 以 检测 有 顾客 在 场 并 通过 某 种 设备 (例如 ， 嵌 人 手机 的 蓝牙 ， 装 有 
射频 标签 的 会 员 卡 ) 确 定 顾客 的 身份 。 在 该 场景 中 ， 有 各 种 传感器 分 布 在 书店 的 书架 和 各 
种 零件 中 ， 这 些 传感器 可 以 检测 到 在 场 的 单个 顾客 。 该 书店 可 以 将 这 些 顾客 的 身份 和 他 们 
的 个 人 信息 (如 爱好 、 购 买 模式 等 ) 联 系 起 来 。 

通过 分 布 在 场所 中 的 这 些 设备 ， 该 书店 可 以 提供 给 顾客 一 个 变化 迅速 的 环境 ， 按 顾客 的 
效益 最 大 化 来 增加 书店 销量 。 例 如 ， 广 播 在 顾客 群 的 听力 范围 内 播放 的 背景 音乐 应 该 是 充分 
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分 析 了 顾客 群 的 爱好 后 得 到 的 。 类 似 地 ， 分 布 在 书店 的 LCD 显示 器 是 基于 附近 的 顾客 来 展 
示 推 荐 的 物品 ， 商 店 展示 窗口 (展示 新 书目 ) 的 LED 灯 可 以 根据 当时 注视 它 的 顾客 的 喜好 和 
兴趣 做 出 调整 等 。 显 然 ， 在 同一 时 间 有 多 人 出 现 的 物理 环境 中 经 常 需要 群体 推荐 技术 。 


21.2.3 基于 场景 的 推荐 系统 


本 节 将 讨论 最 著名 的 组 推荐 系统 : 基于 场景 的 推荐 系统 (scenarios underlying) : 

。 MUSICFX[L15j] 选 择 一 个 广播 电台 作为 健身 中 心 的 背景 音乐 ， 使 其 适合 在 特定 时 间 

健身 的 人 群 ， 这 与 上 面 提 到 的 环绕 智能 场景 相似 。 

POLYLENS[ 17 ]# MOVIELENS 系统 组 推荐 上 的 推广 。MOVIELENS 基于 单个 用 

户 的 喜好 来 推荐 影片 ， 而 单个 用 户 的 喜好 是 通过 评分 系统 和 群体 过 滤 推 断 出 的 。 

POLYLENS 允许 用 户 创建 组 并 可 以 请 求 组 推荐 。 

。 INTRIGUE[2] 通 过 考虑 团体 中 成 员 ( 如 孩子 和 残障 人 士 等 ) 的 特点 来 向 旅行 团 推荐 旅 
游 地 点 。 

* TRAVEL DECISION FORUM[L7] 帮 助 一 个 团体 实现 一 个 共同 所 期 望 的 度假 计划 。 用 
户 用 一 组 特征 集合 (如 运动 和 室内 设施 ) 标 出 他 们 的 偏好 ， 对 于 这 些 特征 ， 系 统合 
并 单个 用 户 的 偏好 ， 用 户 通过 与 代表 组 内 其 他 成 员 的 会 话 代 理 相 互 影响 从 而 达到 
可 接受 的 组 偏好 。 

。 协同 咨询 旅游 系统 (CATS)[16] 帮 助 用 户 选择 度假 方式 。 用 户 先 考虑 度假 计划 ， 并 
根据 计划 的 特点 做 出 评价 (例如 ,， “喜欢 样 图 中 所 示 的 ,但 是 缺 个 游泳 池 ”)。 基 于 
这 些 评价 ， 系 统 向 他 们 推荐 合适 的 度假 计划 。 用 户 常常 选择 他 们 喜欢 的 度假 物品 
使 组 内 的 其 他 成 员 看 到 ， 并 标注 出 他 们 如 何 匹配 组 内 每 个 成 员 的 喜好 (从 他 们 的 评 
价 中 得 出 )。 可 用 单个 成 员 的 评价 生成 组 偏爱 模型 ， 并 基于 这 个 模型 给 用 户 推荐 其 
他 的 度假 物品 。 

。 YU 的 电视 推荐 人 [20] 向 群 组 推荐 电视 节目 。 它 是 基于 单个 用 户 喜 欢 的 电视 节目 
的 特征 (如 类 型 风格 、 演 员 、 关 键 词 等 ) 做 出 推荐 的 。 


21.2.4 基于 分 类 的 群 组 推荐 


和 以 上 提出 的 场景 在 模式 上 有 所 不 同 ， 这 是 一 种 基于 分 类 的 组 推荐 技术 : 

。 单个 用 户 的 喜好 是 已 知 的 ， 还 是 随 着 时 间 发 生变 化 的 。 在 多 数 场 景 中 ， 组 推荐 从 
单个 用 户 偏好 着 手 ， 有 时 需 考虑 单个 用 户 的 喜好 是 随时 间 变 化 的 ， 如 在 CATS R 
统 中 使 用 一 种 基于 评论 的 方法 ， 在 第 13 章 中 讨论 了 这 种 评论 和 它 在 组 推荐 系统 中 
扮演 的 角色 。 

。 推荐 物品 能 被 大 家 感受 到 ， 还 是 只 作为 选项 展示 。 在 交互 式 电视 场景 中 ， 大 家 一 
起 观看 新 闻 。 在 环绕 智能 和 MUSICFX 场景 中 ， 人 们 一 起 欣赏 音乐 。 相 反 地 ， 在 
一 些 其 他 场景 ， 他 们 提供 给 用 户 一 个 推荐 列表 。 例 如 ，POLYLENS 系统 为 组 用 户 
提供 一 个 可 能 喜欢 的 电影 的 列表 。 

。 群 组 的 特征 是 被 动 的 ， 还 是 积极 的 。 在 大 多 数 场景 中 ， 用 户 群 并 不 需要 像 聚 合 单 
个 用 户 偏 好 那样 互动 。 但是， 在 TRAVEL DECISION FORUM 和 CATS 中 ,用 
户 群 组 通过 共同 参与 构造 组 模型 。 

。 推荐 单个 物品 ， 还 是 推荐 一 系列 。 在 MUSICFX, POLYLENS fii Y U' S TV REC- 
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OMMENDER 的 场景 中 ， 只 推荐 一 个 节目 通常 就 足够 了 ， 因 为 人 们 通常 每 晚 只 看 
一 部 电影 ， 电 台 可 以 一 直 不 停 播放 ，YU' S TV RECOMMENDER 也 仅 选 择 一 部 
电视 节目 。 类 似 地 ，TRAVEL DECISION FORUM 和 CATS 的 用 户 一 次 只 选择 
一 个 度假 物品 。 相 反 地 ， 在 交互 式 电视 使 用 场景 中 ， 用 户 被 推荐 一 系列 的 电视 节 
目 ， 如 编辑 一 个 完整 的 新 闻 播 报 。 同 样 ， 在 INTRIGUE 的 应 用 场景 中 ， 一 个 旅行 
团 在 他 们 的 旅途 中 会 参观 多 个 景点 ， 所 以 他 们 可 能 会 对 一 系列 的 景点 感 兴趣 。 与 
之 类 似 的 ， 在 外 界 环境 场景 中 用 户 可 能 会 听 多 首 歌 曲 或 者 在 店内 展示 屏 上 查看 多 
个 条 目 。 

在 本 章 中 ， 我 们 将 关注 包含 以 下 特点 的 例子 ， 即 单个 用 户 喜 好 已 知 ， 组 用 户 直 接 体验 
的 物品 ， 群 组 特征 是 被 动 的 ， 按 系列 推荐 。 系 列 推荐 引出 一 些 有 趣 的 问题 ， 即 关注 订阅 序 
列 ( 见 21. 4 节 ) 和 考虑 单个 用 户 情绪 状态 ( 见 21.5 节 和 21.6 节 )。 对 于 有 鲜明 主题 经 验 的 
组 来 说 ， 这 点 尤其 重要 ， 也 就 是 ， 组 内 推荐 这 种 方法 是 可 行 的 。 

DeCampos 等 的 基于 分 类 的 组 推荐 方法 亦 清 晰 地 区 分 了 被 动 组 和 积极 组 [4]。 他 还 使 
用 了 另外 两 种 特征 : 

。 单个 用 户 的 喜好 是 如 何 获得 的 。 他 们 区 分 了 基于 内 容 和 协同 过 滤 两 种 情况 。 对 于 

上 面 提 到 的 诸多 系统 ，POLYLENS 是 唯一 一 个 使 用 用 户 协同 过 滤 这 种 方法 的 。 

。 是 对 推荐 结果 合并 还 是 对 推荐 模型 合并 。 对 于 前 者 ， 先 为 单个 用 户 产 生 推荐 列表 ， 
然后 再 将 这 些 列表 合并 人 组 推荐 。 对 于 后 者 ， 根 据 单个 用 户 喜 好 将 推荐 模型 合并 
生成 组 模型 ， 然 后 用 该 组 模型 产生 组 推荐 的 结果 。 他 们 指出 INTRIGUE 和 
POLYLENS 是 对 推荐 结果 合并 ， 而 其 他 推荐 系统 是 对 模型 的 合并 。 

这 两 个 特征 与 组 推荐 系统 如 何 执行 相关 ， 而 不 是 使 用 场景 所 固有 的 。 在 本 章 中 ， 我 们 

将 关注 模型 的 合并 ， 但 是 所 提 到 的 合并 都 指 的 是 相同 的 合并 策略 。 本 章 中 列举 的 资料 与 单 
个 用 户 喜 好 获得 的 方法 无 关 。 


21.3 合并 策略 


群 组 推荐 需要 解决 的 主要 问题 是 当 基 于 单个 用 户 的 喜好 信息 时 ， 如 何 得 出 群 组 的 评 
分 。 例 如 ， 假 设 这 个 群 组 包含 3 个 成 员 : Peter, Jane 和 Mary。 假 设 一 个 系统 知道 这 三 个 
人 一 起 出 现 并 知道 他 们 各 自 的 兴趣 信息 ， 这 些 信息 分 别 包 含 在 他 们 各 自 对 物品 评分 列表 中 
(如 对 音乐 专辑 或 者 广告 的 评分 )。 表 21. 1 给 出 了 单个 用 户 对 物品 进行 10 分 制 评分 的 例子 
(1 代表 非常 讨厌 ，10 代表 非常 喜欢 )， 系 统 如 何在 指定 的 时 间 给 出 第 四 项 条 目 ( 即 群 组 评分 ) 。 


表 21.1 单个 用 户 对 10 个 物品 评级 的 例子 (Ato J) 





21.3.1 合并 策略 概览 


现 有 很 多 将 单个 评分 合并 人 群 组 评分 的 策略 (例如 ， 在 一 个 政党 领袖 选举 中 的 应 用 ) 。 
例如 ，“ 最 小 损失 策略 ”采用 评分 中 的 最 小 值 来 避免 为 群 组 成 员 带 来 损失 ( 见 表 21 2), 
受 “ 社 会 选择 ”理论 的 启发 ， 表 21. 3 中 列举 了 11 种 合并 策略 (具体 细节 见 文献 [10])。 
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21.3.2 合并 策略 在 相关 工作 中 的 应 用 


大 多 数 相关 工作 使 用 表 21. 3 所 列举 的 合并 策略 中 的 一 种 (通常 伴随 一 些小 的 改进 )， 
BRE M 
INTRIGUE 使 用 一 种 加 权 模 式 的 平均 策略 。 该 系统 做 出 的 群体 推荐 考虑 了 不 同类 
型 子 群 的 偏好 ， 如 儿童 、 残 障 人 士 等 。 该 策略 取 平 均值 时 ， 其 中 的 各 权 值 基 于 各 
子 群 的 人 数 和 子 群 的 相关 性 而 定 ( 儿 童 和 残障 人 士 被 分 配 较 高 的 相关 性 ) 。 

。 POLYLENS 使 用 最 小 损失 策略 ， 它 是 假定 一 群 人 一 起 去 看 电影 和 最 不 快乐 的 成 员 
相 比 总 有 一 小 群 人 是 快乐 的 。 

* MUSICFX 使 用 一 个 变种 的 平均 无 风险 策略 。 用 户 对 所 有 的 广播 站 进行 评分 ， 评 
分 范围 为 十 2( 非 常 喜欢 ) 到 一 2( 非 常 讨厌 )。 将 这 些 评分 转换 为 正 数 (通过 加 2 得 
到 ) 并 对 它们 求 平方 以 扩大 最 受 欢迎 和 最 不 受 欢迎 站 点 之 间 的 分 值 差距 。 平 均 无 风 
险 策略 用 来 产生 一 组 列表 : AMER FRSA wR. AT RRR 
现象 (列表 得 不 到 更 新 ) 和 总 是 选取 同一 个 站 点 ， 对 列表 中 排 在 首位 的 站 点 进行 随 
机 加 权 选 择 。 

。 YU'S TV RECOMMENDER 使 用 一 种 变种 的 平均 策略 。 它 的 群体 推荐 是 建立 在 
单个 用 户 对 节目 特征 的 评分 上 的 : 一 1 表示 不 喜欢 的 特征 ， 十 1 表示 喜欢 的 特征 ， 
0 表示 中 立 。 使 团体 的 特征 向 量 与 单个 成 员 的 特征 向 量 之 间 的 距离 最 小 ， 这 种 方 
法 类 似 于 对 每 个 特征 的 评分 取 平 均 。 

。 TRAVEL DECISION FORUM 运用 了 多 种 策略 ， 包 括 平均 策略 和 中 位 数 策略 。 中 
位 数 策略 (不 包含 在 表 21. 3 中 ) 使 用 评分 的 中 间 值 。 因 此 ， 对 于 我 们 所 举 的 例子 ， 
A 的 群体 评分 结果 为 10，F 为 9。 中 位 数 策略 常 因 其 不 易 被 人 为 操纵 而 被 选用 : 
使 用 者 无 法 通过 给 出 一 个 极端 的 评分 (不 能 真实 地 反映 他 们 的 观点 ) 将 结果 导向 对 
自己 有 利 的 方向 。 相 反 ， 如 使 用 最 小 风险 策略 时 ， 不 诚实 的 使 用 者 可 以 通过 给 出 
一 个 极端 负面 的 评价 来 避免 得 到 他 们 只 是 稍微 不 喜欢 的 物品 。 操 纵 评价 结果 的 问 
题 在 以 下 情况 下 显得 非常 重要 : 当 用 户 提供 明确 的 评价 时 ， 只 针对 群体 进行 推荐 
并 且 其 他 人 的 评价 是 可 获得 的 ，TRAVEL DECISION FORUM 就 是 其 中 的 一 个 例 
子 。 在 以 下 情况 下 会 显得 不 那么 重要 : 评价 是 由 用 户 行为 推断 得 来 的 ， 同 时 应 用 
于 单个 用 户 推荐 并 且 用 户 无 法 得 知 其 他 人 的 评价 (即使 使 用 了 合并 策略 ) 。 

。 在 CATS 中 ， 用 户 通 过 评论 来 标示 一 个 度假 物品 应 该 包含 哪些 特征 。 对 于 确定 的 
特征 ， 用 户 标示 他 们 是 否 需 要 (如 滑冰 的 需求 )。 对 于 另外 的 特征 ， 他 们 标示 数量 
(如 至 少 3 个 滑雪 电梯 ) 。 群 组 模型 包含 所 有 用 户 的 需求 ， 那 些 满足 大 多 数 需 求 的 
物品 将 获得 推荐 。 用 户 也 可 以 完全 舍弃 一 些 度假 物品 ， 因 此 该 策略 包含 无 风险 的 
一 面 。 
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表 21.3 合并 策略 方法 综述 
合并 策略 如 何 运 行 实例 
当 A 是 群 组 里 大 多 数 人 评分 最 高 时 ， 就 选 


采用 “得 票 最 多 者 获胜 ”的 原则 : 相 类 似 ， 投 


简单 多 数 投票 5 : 择 A, E 紧 随 其 后 (如 果 排 除 A 后 ，E 的 评分 
票 最 多 的 物品 被 挑选 就 是 最 高 的 ) l 
平均 对 所 有 单个 用 户 的 评分 取 平 均值 B 的 群 组 评分 是 6， 即 (4 十 9 十 5)/3 
乘法 对 所 有 单个 用 户 的 评分 取 乘 积 B 的 群 组 评分 是 180， 即 4X9X5 
根据 物品 在 单个 用 户 偏好 列表 中 的 排名 计 A 的 群 组 评分 是 17， 即 0(Jane 的 最 后 一 
波 达 计数 数 ， 排 名 最 后 的 物品 得 0 分 ， 靠 前 一 位 的 得 1 | 位 ) 十 9(Mary 的 第 一 位 ) 十 8(Peter 的 并 列 第 
分 ， 以 此 类 推 3 位 ) 
科普 兰 规则 计算 物品 根据 简单 多 数 方法 胜 过 其 他 物品 的 F 的 群 组 评分 是 5， 因 为 F 胜 过 了 7 个 物品 (C， 
= 次 数 减 去 输 给 其 他 物品 的 次 数 D，G，H，I，J) ， 输 给 了 2 个 物品 (A，E) 
通过 投票 计算 评分 超过 某 个 通过 阔 值 (比如 6) 的 单个 B 的 群 组 评分 是 1, 是 3 
用 户 个 数 
最 小 损失 选取 单个 用 户 评分 的 最 小 值 B 的 群 组 评分 是 4， 即 4，9，5 中 的 最 小 值 
最 大 值 选取 单个 用 户 评分 的 最 大 值 B 的 群 组 评分 是 9， 即 4，9，5 中 的 最 大 值 
无 损 平均 TER BAS FH PH VEA TE EA MAC 4) 以 下 的 J 的 群 组 评分 是 7.3(8，8，6 的 平均 值 )， 
物品 之 后 ， 取 平均 值 其 中 A 被 排除 了 ， 因 为 Jane 讨厌 它 
物品 正 有 可 能 被 选 为 第 1 位 (Peter 打分 最 高 
假设 单个 用 户 轮流 选择 物品 来 排名 AY), RAHE Fane 打分 最 高 的 ) 和 A(Mary 
打分 最 高 的 ) 之 后 


如 果 Jane 是 最 受 尊敬 的 人 ， 则 A 的 群 组 评 


- i 
ado Rese eas 分 是 1。 如 果 Mary 是 最 受 尊敬 的 人 ， 则 是 10 


> 
+ 


应 该 注意 的 是 ，YU'S TV RECOMMENDER 和 TRAVEL DECISION FORUM £% 
合 每 个 特征 的 偏好 时 没有 采用 公平 的 想法 : 在 某 个 特征 上 失 分 不 会 让 你 在 另 一 个 特征 上 得 
到 补偿 。 

虽然 MUSICFX, POLYLENS 和 CATS 三 者 在 某 些 评估 方面 有 了 进展 ， 但 对 于 这 些 
系统 中 他 们 的 策略 是 多 么 有 效 和 如 何 根据 不 同 的 效果 来 选择 不 同 的 策略 还 没有 得 到 研究 ， 
在 21.4 节 的 实验 中 我 们 给 出 了 一 些 新 的 解释 。 

与 此 相反 ，Y U'S TV RECOMMENDER 已 经 给 出 了 一 些 评估 方法 [20]。 他 们 发 现 
当 组 成 员 相 对 同 质 时 ， 得 到 的 聚合 效果 很 好 ， 但 当 组 成 员 相 对 异 质 时 结果 却 差 强人 意 ， 这 
样 的 情况 正如 我 们 所 期 望 的 。 如 果 组 内 成 员 非 常 相 似 ， 给 出 的 平均 策略 将 会 使 个 人 相当 满 
意 ， 但 如 果 组 内 成 员 的 喜好 差别 很 大 ， 那 么 结果 将 变 得 很 差 。 


21.3.3 哪 种 策略 效果 最 好 


我 们 进行 了 一 系列 的 实验 来 研究 表 21. 3 所 列 的 策略 中 哪 一 种 是 最 好 的 (细节 详 见 文献 
[10]). 

在 实验 1 中 ( 见 图 21. 1)， 我 们 研究 人 们 以 用 户 作 为 导向 来 评估 是 如 何 解决 这 类 问题 的 
[13]。 给 参与 者 类 似 于 表 21. 1 中 所 列 的 单个 用 户 的 评分 样本 ， 这 些 评分 是 精心 挑选 的 ， 
以 便 在 不 同 的 策略 间 进 行 区 分 。 参 与 者 被 问 及 这 个 群 组 应 该 看 哪些 节目 ， 如 果 时 间 人 允许 可 
以 观看 的 节目 数 分 别 为 1，2，…，7。 在 合并 策略 下 我 们 比较 参与 者 的 决策 和 理由 ， 发 现 
参与 者 更 关注 公平 原则 ， 防 止 损失 和 “饥饿 "(“ 这 一 个 是 献 给 Mary 的 ， 因 为 到 目前 为 止 她 
还 没有 得 到 一 件 她 喜欢 的 ”)。 参 与 者 的 行为 反映 出 几 种 策略 (如 平均 策略 、 最 小 损失 策略 
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和 无 损 平 均 策略 )， 而 另外 一 些 策略 (如 波 达 计数 法 、 科 普兰 规则 ) 却 没有 用 到 。 











我 知道 Peter、Mary、Jane 的 评 
分 值 ， 应 该 推荐 什么 给 这 个 群 组 ? 


样 7 节 新 闻 片段 …… 


图 21.1 实验 1: 如 果 考 虑 系统 任务 ， 人 们 会 挑 什么 样 的 物品 顺序 呢 


在 实验 2( 见 图 21.2) 中， 提供 给 参与 者 一 个 节目 序列 和 表 21. 1 中 的 单个 用 户 评分 ， 
其 中 节目 序列 是 使 用 合并 策略 选 出 的 。 他 们 被 要 求 评估 该 群 组 对 于 这 个 序列 的 喜欢 程度 ， 
并 解释 为 什么 这 样 评估 。 通 过 实验 我 们 发 现 乘法 策略 (将 单个 用 户 评分 相 乘 ) 的 执行 效果 最 
佳 ， 在 某 种 意义 上 参与 者 普遍 认为 它 是 唯一 一 种 选 出 的 节目 序列 可 以 使 团体 中 所 有 成 员 都 
满意 的 策略 ， 波 达 计 数 、 平 均 、 无 损 平 均 和 最 大 值 这 些 策略 也 表现 得 比较 好 。 还 有 一 些 策 
略 ( 如 科普 兰 规则 、 简 单 多 数 投票 、 最 小 损失 ) 似 乎 应 该 被 丢弃 ， 因 为 这 些 策略 相对 某 些 群 
组 成 员 执 行 效果 很 差 。 












你 知道 你 和 你 两 位 朋友 的 个 体 
评分 。 我 已 经 决定 给 你 展示 以 下 
的 序列 ， 你 和 你 的 朋友 会 感到 满 
意 吗 ? 


21.2 实验 2: 人 们 喜欢 什么 


我 们 也 将 参与 者 的 评价 与 简单 满足 模型 图 数 (simple satisfaction modelling functions) 
进行 了 比较 。 除 了 这 些 ， 我 们 发 现 通过 使 用 下 面 的 方法 可 以 得 到 更 加 准确 的 预测 方法 : 
。 二 次 评价 ， 例 如 ， 使 评分 为 9 分 和 10 分 之 间 的 差距 比 5 分 和 6 分 之 间 的 大 。 
。 归 一 化 ,考虑 了 人 们 会 通过 不 同 的 角度 进行 评价 ， 例 如 ， 有 人 使 用 比较 极端 的 分 
值 评 价 ， 而 有 一 些 人 使 用 比较 中 等 的 分 值 评价 。 


21.4 序列 顺序 的 影响 


在 21. 2 节 所 提 到 ， 我 们 对 推荐 物品 的 顺序 很 感 兴趣 。 例 如 ， 对 于 电视 的 个 性 化 新 闻 ， 
推荐 系统 需要 挑选 出 7 个 新 闻 节 目 播放 给 某 个 群 组 。 

选择 节目 时 ， 可 以 使 用 聚合 策略 (如 乘法 策略 ) 来 组 合 单个 用 户 的 偏好 值 ， 然 后 选 出 七 
个 组 评分 最 高 的 新 闻 节 目 。 当 这 些 物 品 选 好 后 ， 剩 下 的 问题 是 以 什么 样 的 顺序 来 播放 这 些 
节目 。 例 如 ， 这 些 新 闻 的 播放 可 以 是 按 组 评分 的 降序 ， 先 是 评分 最 高 的 物品 ， 最 后 是 评分 
最 低 的 。 或 者 ， 也 可 以 把 物品 按 随 机 顺序 播放 。 

然而 ， 我 们 面临 的 问题 在 实际 情况 中 更 加 复杂 。 首 先 ， 在 变化 非常 迅速 的 环境 中 ， 组 
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成 员 身 份 不 断 变化 ， 所 以 ， 以 当前 成 员 的 身份 决定 接 下 来 的 七 个 物品 似乎 不 是 一 个 合理 的 
策略 ， 在 最 坏 的 情况 下 ， 第 七 个 物品 播放 的 时 候 ， 那 些 成 员 可 能 都 已 经 离开 电视 了 。 
其 次 ， 对 新 闻 节 目 播放 列表 的 整体 满意 度 更 多 取决 于 节目 的 播放 顺序 而 不 是 其 中 人 们 
想 看 的 节目 。 例 如 ， 以 获得 最 佳 的 满意 度 ， 我 们 可 能 需要 确保 新 闻 节 目 包 含 以 下 几 个 
| | 
。 一 个 好 的 故事 流 。 把 主题 相关 的 节目 一 起 播放 可 能 是 最 好 的 。 例 如 ， 如 果 我 们 有 
两 则 关于 迈克 尔 。 杰 克 逊 的 新 闻 ( 如 他 的 葬礼 和 相关 的 颂 词 )， 把 它们 一 起 播放 是 
最 好 的 。 同 理 ， 把 所 有 的 体育 新 闻 凑 在 一 块 播放 也 是 合适 的 。 
。 情绪 的 一 致 性 。 把 相同 情绪 的 新 闻 放 在 一 起 可 能 是 最 好 的 。 例 如 ， 观 众 可 能 不 希 
望 看 到 在 两 个 开心 的 新 闻 ( 如 失业 率 下 降 和 比赛 胜利 ) 中 间 出 现 一 个 悲伤 的 新 闻 ( 如 
一 个 士兵 的 死亡 )。 
。 令 人 深刻 的 结尾 。 以 一 个 大 众 喜 欢 的 新 闻 结尾 可 能 是 最 好 的 ， 因 为 这 样 观众 最 能 
记 住 这 个 新 闻 列 表 。 
在 其 他 推荐 领域 中 也 出 现 类 似 的 推荐 顺序 问题 。 例 如 ， 一 个 音乐 节目 排序 歌曲 时 要 考 
虑 它们 的 节奏 。 推 荐 系统 可 能 需要 人 额外 的 信息 (如 歌曲 包含 的 心情 、 主 题 、 节 奏 ) 来 优化 排 
序 。 讨 论 如 何 解决 这 些 问 题 已 经 超出 了 本 章 的 主题 (而 且 这 些 跟 推荐 系统 特定 领域 是 密切 
相关 的 )。 我 们 只 是 想 强 调 , 已 经 显示 的 物品 可 能 影响 在 用 户 心中 最 好 的 下 一 个 物品 是 什 
么 。 例 如 ， 假 设 音乐 推荐 系统 推荐 的 前 四 首都 是 蓝调 歌曲 ， 那 么 排 在 第 六 位 的 蓝调 可 能 比 
排 在 第 五 位 的 古典 戏曲 更 适合 排 在 下 一 位 。 
在 实验 3 中 ( 见 图 21. 3)， 我 们 研究 了 前 一 条 新 闻 可 能 会 影响 用 户 对 下 一 条 新 闻 的 感 
受 。 其 中 包括 ， 我 们 发 现 ， 情 绪 ( 从 上 一 个 物品 产生 的 ) 和 相关 性 会 影响 对 后 续 物 品 的 评 
分 。 这 意味 着 ， 把 个 人 信息 聚合 成 群 组 信息 是 需要 不 断 重 复 进 行 的 ， 每 次 都 要 决定 下 一 个 
要 播放 的 物品 是 什么 。 
[这 里 插入 你 喜欢 的 运动 俱乐部 ] 赢得 了 一 场 重要 比赛。 
Jennifer Lopez 的 豪华 轿车 车 队 100 米 的 旅行 计划 。 
心脏 病 发 生 概率 能 减少 一 半 吗 ? 
欧洲 之 神 是 否 存在 ? 
地 震 效 击 保加利亚 。 
英国 大 火 持续 。 
o 保加利亚 -西班牙 足球 赛况 ， 随 后 是 保加利亚 3 名 主要 球员 受伤 。 








第 一 个 新 闻 节 目 是 “英国 足球 需要 眼 保加利亚 比 V7 
- 3€ . MORIS? 评 评分 。 
EY 


给 7 个 新 闻 节目 评分 。 





图 21.3 实验 3: 研究 新 闻 主题 对 心情 的 影响 


21.5 对 情感 状态 建 模 
为 一 组 人 做 推荐 的 时 候 ， 你 总 不 可 能 任何 时 候 都 给 每 个 人 喜欢 的 东西 。 但 是 ， 你 也 不 
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想 有 人 对 推荐 结果 非常 不 满意 。 例 如 ， 在 一 家 商店 中 ， 如 果 一 个 客户 要 离开 且 不 再 光顾 ， 
是 因为 他 们 实在 受 不 了 背景 音乐 ， 这 是 一 种 不 好 的 情形 。 许 多 商店 目前 选择 播放 一 些 没有 
人 真正 讨厌 ， 但 也 不 会 是 大 多 数 人 喜爱 的 音乐 ， 这 可 能 会 避免 失去 客户 ， 但 不 会 导致 销售 
增长 。 一 个 理想 的 商店 会 把 音乐 调整 到 顾客 的 听 赏 水 平 所 能 接受 的 范围 区 间 内 ， 在 这 个 区 
间 内 挑选 的 歌曲 都 是 顾客 大 多 数 时候 喜 爱 的 (有 助 于 增加 销售 和 顾客 重复 购买 的 可 能 性 ) 。 
为 了 做 到 这 点 ， 不 可 避免 客户 有 时 也 会 听 到 他 们 不 喜欢 的 歌曲 ， 但 发 生 的 这 一 时 刻 顾客 还 
是 能 忍受 的 (例如 ， 因 为 上 一 首 歌 他 们 非常 喜爱 的 ， 所 以 他 还 是 处 于 很 好 的 心情 )。 因 此 ， 
持续 地 监控 组 成 员 的 满意 度 是 很 重要 的 。 当 然 ， 如 果 要 顾客 必须 对 他 们 接触 到 的 音乐 、 广 
告 等 进行 评分 ， 这 无 疑 会 给 顾客 带 来 不 能 接受 的 负担 。 类 似 地 ， 通 过 传感器 (如 心跳 速率 
监视 器 或 面部 表情 识别 器 ) 测 量 这 种 满足 感 还 不 是 一 个 很 可 行 的 做 法 ， 因 为 这 些 做 法 对 顾 
客 太 过 滋 扰 ， 结 果 也 不 准确 ， 而 且 成 本 昂贵 。 因 此 ， 我 们 建议 对 组 成 员 的 满意 度 建 模 ， 根 
据 我 了 解 到 他 们 的 喜好 进行 预测 。 


21.5.1 对 个 人 的 满意 度 进行 建 模 


在 文献 [12] 中 ， 我 们 研究 对 个 人 满意 度 建 模 的 四 个 满意 度 函 数 。 我 们 比较 了 这 些 函 数 
对 于 满意 度 的 预测 与 实际 用 户 的 满意 度 。 我 们 还 完成 了 一 项 ( 见 图 21. 4) 关 于 预测 与 用 户 真 
实感 受 实验 的 比较 。 






这 是 一 个 英文 
单词 四 ?20 秒 
内 回答 ) 


: 
20 个 中 你 猜 对 了 20 个 中 你 猜 对 了 15 个 。 你 对 
5 个 。 你 对 自己 的 自己 的 表现 作 何 评价 ? 对 自己 
表现 作 何 评价 ? 的 整体 表现 满意 吗 ? 


















图 21.4 实验 4: 通过 回答 一 系列 问题 得 出 整体 满意 度 


满意 度 函 数 很 好 地 定义 了 用 户 在 看 完 一 组 物品 序列 后 对 一 个 新 物品 的 满意 程度 ， 


如 下 : 


站 RS 二 ô X Sat(items) + Impact Sat (items ) ) (21.1) 


其 中 ， 给 定 已 有 满意 度 下， 对 新 物品 i 满意 度 的 影响 定义 为 

Impact(i,s) = Impact(i) + (s — Impact(i)) X e;for0 x e < lando < ô <1 

(21. 2) 

参数 6 代表 了 满意 度 随 时 间 的 训 减 (6=0 代表 过 去 的 物品 没有 任何 影响 了 ， 而 6 二 1 说 
明 这 个 物品 没有 任何 衰减 ) 。 

参数 代表 了 用 户 经 历 了 前 一 个 物品 后 ， 对 新 物品 满意 度 的 变化 。 这 个 参数 是 从 心理 
学 和 经 济 学 的 文献 中 启发 得 来 的 ， 说 明了 心情 确实 会 影响 价值 判断 [12]。 比 如 ， 半 数 参 与 
电视 问卷 调查 的 人 ， 如 果 先 收 到 一 个 小 礼物 ， 他 们 的 心情 都 很 好 。 推 荐 给 这 些 参与 者 的 电 
视 节目 都 有 不 错 的 效果 。 因 此 ， 如 果 一 个 用 户 由 于 喜欢 之 前 的 物品 带 来 了 好 心情 ， 下 次 出 
现 了 一 个 他 不 太 喜 欢 的 物品 时 ， 不 好 影响 也 通常 较 小 (多 少 取决 于 e)。 

参数 $ Me 是 依赖 于 用 户 的 (在 文献 [12] 的 实验 中 证 实 了 )。 我 们 不 会 在 本 章 中 定义 
Impact(i) ， 相 关 详 细 信 息 参 考 文献 [12]， 但 它 涉及 二 次 评分 和 规范 化 如 上 面 所 讨论 的 实 


458 第 四 部 分 推荐 系统 与 群体 


验 中 发 现 的 那样 。 
21.5.2 个 人 满意 度 对 群 组 的 影响 


上 述 满意 度 函 数 并 未 考虑 群 组 内 其 余 成 员 的 满意 度 ， 事 实 上 他 们 的 满意 度 也 会 影响 个 
人 的 满意 度 。 正 如 在 社会 心理 学 [12] 中 讨论 过 的 ， 这 里 会 发 生 两 个 主要 的 现象 。 

情绪 感染 。 首 先 ， 其 他 用 户 的 满意 度 可 能 会 导致 所 谓 的 情绪 感染 其 他 用 户 感到 满意 
可 能 会 提升 其 中 某 位 用 户 的 满意 度 ( 例 如 ， 如 果 有 人 向 你 微笑 ， 你 自然 也 会 报 以 微笑 ， 感 
觉 会 更 好 )。 相 反 的 情况 也 会 发 生 : 其 他 用 户 感到 不 满意 可 能 也 会 降低 某 位 用 户 的 满意 度 。 
例如 ， 如 果 你 和 你 的 朋友 去 看 电影 ， 当 你 的 朋友 明显 不 太 喜 欢 这 部 电影 的 时 候 ， 这 种 情况 
可 能 会 让 你 对 该 电影 有 一 个 负面 的 影响 。 

情绪 感染 可 能 取决 于 你 的 性 格 ( 有 些 人 更 容易 被 别人 影响 )， 以 及 与 其 他 人 的 关系 。 人 
类 学 家 和 社会 心理 学 家 已 经 发 现 有 四 种 基本 类 型 的 社交 关系 ， 见 图 21.5。 在 实验 5( 见 图 
21. 6) 中 ， 我 们 证 实 了 情绪 感染 确实 取决 于 你 的 关系 : 你 更 容易 被 某 些 你 爱 的 人 感染 (如 你 
最 好 的 朋友 ) 或 你 尊重 的 人 感染 (你 的 母亲 或 老板 ) ， 这 种 感染 程度 超过 平等 的 或 者 与 之 竞 
争 的 关系 。 







“可 以 与 你 分 享 
任何 事情 的 人 ， 
如 最 好 的 朋友 ” 


“你 非常 尊敬 的 人 ” 






公共 分 享 权威 性 排名 


“你 要 处 理应 对 的 人 ” 









市 场 定 价 






如 果 你 有 一 个 愿意 与 其 分 享 你 
所 有 事情 的 人 可 能 是 你 最 好 
的 朋友 ) ， 假 设 你 和 这 个 人 一 
起 看 电视 ， 你 对 这 个 节目 兴趣 
不 大 ， 当 你 得 知 这 个 人 非常 喜 
欢 或 非常 讨厌 这 个 节目 ， 你 有 
何 感受 ? 












图 21.6 实验 5: 情绪 感染 对 关系 类 型 的 影响 


从 众 心 理 。 其 次 ， 其 他 用 户 的 观点 可 能 会 影响 你 自己 表达 的 观点 ， 这 是 基于 所 谓 从 众 
心理 。 

图 21.7 显示 了 著名 的 由 Asch[3] 开 展 的 从 众 心理 实验 。 与 会 者 提出 了 一 个 很 容易 的 
事 ， 如 判断 四 条 线段 中 的 哪 一 条 与 卡片 A 中 的 线段 方向 相同 : 参与 实验 者 认为 他 们 被 其 他 
参与 者 所 包围 ， 但 实际 上 其 他 人 是 实验 团队 成 员 ， 而 这 些 成 员 会 事先 约定 选择 相同 的 错误 
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答案 。 结 果 表 明 ， 大 多 数 参 与 实验 者 也 会 选择 同样 的 错误 答案 。 
卡片 1 2 


AA 





图 21.7 从 众 心理 实验 (来 自 Asch) 


有 两 种 从 众 类 型 : 1) 规范 化 影响 ， 即 你 希望 成 为 集团 的 一 分 子 ， 所 以 赞同 组 内 其 他 成 
员 的 意见 ， 即 使 跟 你 内 心 的 信念 并 不 一 致 ，2) 信 息影 响 ， 你 的 观点 改变 是 因为 你 认同 集体 
观点 是 对 的 。 信 息影 响 会 改变 你 的 满意 度 ， 而 规范 化 影响 可 以 通过 情绪 感染 改变 其 他 人 的 
满意 度 ， 因 为 你 描述 了 一 种 不 诚恳 的 情绪 。 

更 多 复杂 的 满意 度 函 数 可 参见 文献 [12]， 相 关 研 究 对 情绪 感染 和 两 种 从 众 心理 类 型 进 
行 了 建 模 。 


21.6 情感 状态 在 合并 策略 中 的 使 用 


一 旦 建立 了 准确 的 个 人 满意 度 模型 ， 最 好 使 用 该 模型 改善 组 合并 策略 。 例 如 ， 这 种 合 
并 策略 可 以 满足 群 组 中 满意 度 最 低 的 成 员 。 这 可 以 由 许多 不 同方 式 实现 ， 而 我 们 才刚 刚 开 
始 研 究 该 问题 ， 例 如 : l 
。 强 支 持 最 挑 吻 用户 策略 。 该 策略 是 挑选 满意 度 最 低 的 用 户 最 喜欢 的 物品 。 如 果 存 
在 多 个 这 样 的 物品 ， 则 使 用 标准 合并 策略 ， 如 乘法 策略 ， 来 进行 区 分 。 
。 弱 支 持 最 挑 易 用 户 策略 。 该 策略 是 挑选 满意 度 最 低 的 用 户 比较 喜欢 的 物品 ， 比 如 ， 
评分 在 8 分 或 者 以 上 的 物品 。 此 时 使 用 标准 合并 策略 ， 如 乘法 策略 ， 在 这 些 物 品 
中 进行 选择 。 
。 加 权 策 略 。 该 策略 是 根据 用 户 满 意 度 来 给 用 户 分 配 权 重 ， 然 后 使 用 一 个 加 权 形 式 
的 标准 合并 策略 。 比 如 ， 表 21. 4 显示 当 使 用 了 平均 策略 时 ， 分 配 2 倍 权重 给 Jane 
的 效果 。 注 意 ， 权 重 不 能 应 用 于 某 些 策略 ， 如 最 小 损失 策略 。 
文献 [14] 中 详细 地 讨论 了 这 一 点 ， 提 出 一 种 基于 代理 的 架构 来 将 这 些 创 意 应 用 在 智能 
场景 ， 并 描述 了 实现 的 原型 。 显 然 ， 在 探索 合并 策略 中 使 用 情感 状态 的 最 佳 方式 时 需要 实 
证 研究 。 
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表 21.4 为 Jane 分 配 相同 权重 和 两 倍 权重 后 的 平均 策略 结果 


Average(equal weights) 





Average(Jane twich) 


21.7 对 单个 用 户 进行 组 推荐 


如 果 你 打算 开发 一 个 为 单个 用 户 进行 组 推荐 的 应 用 又 该 如 何 做 ? 组 推荐 技术 在 三 个 方 
面 产生 效用 : 1) 合 并 多 准则 ; 2) 解决 所 谓 的 冷 启 动 问题 ; 3) 考 虑 其 他 的 观点 。 第 22 章 也 
探讨 了 在 给 个 人 推荐 时 聚合 的 必要 性 ， 并 包括 了 几 种 具体 的 聚合 函数 。 


21.7.1 多 准则 


由 于 问题 是 多 维度 的 ， 有 时 候 很 难 给 出 推荐 : 此 时 多 重 标准 发 挥 作用 。 例 如 ， 在 新 闻 
的 推荐 系统 中 ， 用 户 可 能 有 地 理 位 置 的 偏好 (对 离 家 近 的 报道 更 感 兴趣 ， 或 者 与 他 们 热衷 
的 度假 地 区 相关 的 报道 )。 用 户 可 能 更 喜欢 最 近 的 新 闻 ， 或 者 有 主题 偏好 (比如 ， 偏 向 于 政 
治 新 闻 而 不 是 体育 新 闻 )。 推 荐 系统 可 能 得 到 类 似 于 表 21. 5 的 结果 ， 这 里 不 同 的 新 闻 在 不 
。 同 的 标准 下 评分 不 同 。 那 么 该 推荐 哪个 新 闻 报 道 呢 ? 


表 21.5 基于 不 同 标准 下 对 10 个 新 闻 报 道 的 评分 


Location 


Recency 





多 准则 的 问题 将 在 第 24 章 中 详细 讨论 。 这 里 将 讨论 在 组 推荐 系统 中 如 何 处 理 这 些 
问题 。 
除了 有 多 个 标准 而 非 多 个 用 户 要 满足 ， 表 21. 5 与 上 述 的 组 推荐 类 似 ( 表 21. 1) 。 对 于 
该 问题 ， 我 们 可 以 应 用 组 推荐 技术 。 然 而 ， 适 应 一 群 人 和 适应 一 组 标准 之 间 有 着 重要 区 
别 。 为 了 适应 一 群 人 ， 公 平地 对 待 每 一 个 人 似乎 是 合理 的 和 道德 上 正确 的 。 当 然 ， 可 能 有 
一 些 例外 ， 例 如 ， 当 组 中 包含 成 人 和 儿童 ， 或 者 当 它 是 某 人 的 生日 时 。 但 总 的 来 说 ， 平 等 
似乎 是 一 个 不 错 的 选择 ， 而 且 也 被 用 于 上 述 的 组 适应 策略 。 与 此 相反 ， 适 应 一 组 标准 时 ， 
这 里 没有 特别 理由 来 假定 所 有 标准 都 是 重要 的 。 甚 至 可 能 对 一 个 特定 的 人 而 言 ， 并 不 是 所 
有 的 标准 都 同样 重要 。 事 实 上 ， 实 验 发 现 用 户 对 待 标准 的 方式 不 同 ， 会 对 某 些 标 准 给 予 更 
多 的 重视 (例如 ， 最 近 行为 比 位 置 更 重要 )[11]。 那 么 ,该 如 何 使 用 组 推荐 策略 来 处 理 这 种 
问题 呢 ? 有 多 种 方法 可 以 做 到 : 
。 把 策略 应 用 于 最 重视 的 标准 上 。 不 重要 的 评分 标准 可 以 完全 忽略 。 例 如 ,- 假定 “位 
置 "标准 被 认为 是 不 重要 的 ， 那 么 它 的 评分 就 可 以 忽略 。 表 21.6 显示 了 忽略 位 置 
时 的 平均 策略 结果 。 
。 把 策略 应 用 于 所 有 的 标准 且 使 用 权重 。 在 不 重要 的 标准 上 的 评分 可 以 赋予 较 小 的 
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权重 。 例 如 ， 在 平均 策略 上 ， 某 个 标准 的 权重 乘 以 该 标准 的 评分 ， 从 而 产生 新 的 
评分 。 举 例 来 说 ,假设 主题 和 近期 效应 标准 的 重要 性 三 倍 于 位 置 标准 的 重要 性 。 
X 21.7 显示 了 使 用 了 这 些 权重 的 平均 策略 结果 。 若 使 用 乘法 策略 ， 评 分 与 权重 相 
乘 没有 任何 影响 。 在 乘法 策略 中 ， 把 权重 作为 指数 因子 更 好 ， 因 此 把 权重 作为 评 
分 的 寄 ， 得 到 新 的 值 取 代 原 有 评分 。 请 注意 ， 在 上 述 两 种 策略 中 ， 零 权重 会 导致 
评分 被 完全 忽略 。 

。 调整 策略 使 重要 与 非 重 要 的 标准 表现 不 同 : 无 损 不 等 均值 。 重 要 标准 的 损失 可 以 
避免 ， 但 非 重要 标准 则 不 能 。 假 设 标准 位 置 再 次 被 认为 是 不 重要 的 。 表 21.8 显示 
T BIB 6 的 无 损 不 等 均值 策略 的 结果 


表 21.6 剔除 了 不 重要 的 位 置 标准 的 平均 策略 
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有 证 据 表 明 ， 人 们 的 行为 反映 了 这 些 策 略 的 结 RCI. 然而 ， 在 该 领域 要 知道 哪些 策 
略 是 最 好 的 ， 还 需要 更 多 的 研究 。 此 外 ， 还 需要 更 多 的 研究 来 确定 一 个 标准 是 “不 重 
要 ”的 。 

多 准则 问题 也 是 本 手册 其 他 章节 ( 见 第 24 章 ) 讨 论 的 主题 。 


21.7.2 冷 启动 问题 


推荐 系统 的 一 大 问题 是 所 谓 的 冷 启动 问题 : 为 适应 用 户 ， 系 统 需要 知道 用 户 过 去 喜欢 
什么 。 这 在 基于 内 容 过 滤 推 荐 中 是 必要 的 ， 用 来 选 定 与 用 户 喜 欢 的 物品 相似 的 物品 。 在 社 
会 化 推荐 中 ， 决 定 和 当前 用 户 相似 的 用 户 在 过 去 时 间 里 对 相同 物品 的 喜 恶 是 必要 的 ( 见 图 
21. 8) 。 如 果 你 对 用 户 一 无 所 知 ， 因 为 用 户 才刚 刚 开 始 使 用 推荐 系统 ， 该 怎么 办 ? 推荐 系 
统 的 设计 者 倾向 于 用 以 下 两 种 方法 解决 问题 : 要 么 让 用 户 一 开始 就 对 物品 进行 评分 ， 要 人 么 
让 他 们 回答 一 些 人 口 统 计 学 方面 的 问题 (然后 再 使 用 固有 的 模式 作为 起 点 ， 如 老人 喜欢 古 
典 音乐 ) 。 
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这 两 种 方法 都 需要 用 户 花费 精力 。 挑 选 哪些 物品 让 用 户 去 评分 也 不 是 容易 的 事情 ， 某 
些 固有 模式 有 可 能 是 错误 的 并 具有 冒犯 性 的 (有 的 老人 喜欢 流行 音乐 ， 而 且 并 不 喜欢 被 归 
类 为 老年 人 )。 

本 章 所 提 到 的 组 推荐 研究 提供 了 另 
一 种 解决 方案 。 对 于 推荐 系统 新 用 户 ， 
为 其 提供 使 得 现 有 群体 中 用 户 都 满意 的 
推荐 。 假 设 该 用 户 与 某 个 已 存在 的 用 户 
相似 ， 虽 然 不 知道 是 娜 一 个 用 户 ， 既 然 
推荐 结果 能 让 群体 中 的 用 户 都 快乐 ， 新 
用 户 同样 也 会 快乐 的 。 

我 们 将 逐步 地 了 解 该 新 用 户 的 偏 
好 ， 例 如 ， 通 过 分 析 他 们 对 推荐 物品 的 
评分 ， 或 者 更 隐 含 一 点 ， 通 过 分 析 他 们 
在 推荐 结果 上 花 的 时 间或 花 不 花 时 间 。 
我 们 提供 使 得 已 有 用 户 和 新 用 户 都 开心 
的 推荐 结果 给 该 新 用 户 (或 者 更 确切 地 
说 ,被 假设 为 新 用 户 的 人 )。 刚 开始 赋 
予 新 用 户 的 权重 较 小 ， 因 为 对 他 们 了 解 
不 多 ， 然 后 再 逐渐 增加 权重 。 我 们 也 开 
始 分 配 较 小 的 权重 给 一 些 现 有 用 户 ， 这 
些 现 有 用 户 的 品味 现在 显著 不 同 于 该 新 图 21.9 逐步 学 习 这 位 用 户 及 她 与 哪 位 用 户 最 相似 
用 户 。 

图 21.9 展示 了 一 个 适应 的 例子 : 该 系统 包括 观察 到 的 新 用 户 在 一 定 程度 上 的 品味 ， 
并 开始 减少 一 些 其 他 用 户 的 权重 。 长 期 使 用 该 系统 后 ， 用 户 的 推断 愿望 将 彻底 主宰 物品 先 
择 。 我 们 使 用 了 MovieLens 的 数据 集 对 该 方法 的 有 效 性 进行 了 小 规模 的 研究 。 

我 们 随机 选 了 5 部 电影 和 12 位 评价 过 这 些 电影 的 用 户 : 其 中 推荐 系统 已 知 的 有 10 
人 ， 新 用 户 为 2 人 。 在 已 知 用 户 组 使 用 乘法 策略 ， 得 到 新 用 户 的 电影 排名 。 结 果 令 人 鼓 
9. 在 电影 中 排名 最 高 的 电影 ， 其 实 是 新 用 户 最 喜欢 的 电影 ， 同 时 根据 新 用 户 的 信息 ， 其 他 
电影 的 排名 也 还 可 以 。 使 用 权重 可 进一步 改进 排名 方法 ， 同 时 权重 开始 反映 新 用 户 和 已 知 用 
户 的 相似 性 。 文 献 [9] 中 给 出 了 研究 和 应 用 群体 适应 策略 来 解决 淮 启 动 问题 的 更 多 细节 。 


21.7.3 虚拟 组 成 员 






她 类 似 哪 种 人 ? 





最 后 ， 组 适应 也 可 以 用 于 个 人 ， 做 法 是 把 虚拟 的 人 物 加 入 组 里 。 例 如 ， 对 于 小 孩子 看 
电视 娱乐 ， 父 母 并 不 反对 ， 但 也 希望 小 孩子 能 偶尔 学 到 点 什么 。 当 小 孩 一 个 人 的 时 候 ， 父 
母 信 息 可 以 作为 虚拟 组 成 员 加 入 小 孩 的 组 里 面 ， 这 样 电 视 节目 可 以 同时 满足 父母 和 孩子 的 
需求 。 


21.8 总 结 与 挑战 


组 推荐 是 一 个 相对 较 新 的 研究 领域 。 本 章 的 目的 是 介绍 该 领域 ， 尤其 是 聚合 个 人 用 户 
信息 方面 。 欲 了 解 更 多 信息 请 参见 文献 [10，12，14，11，9，7，8]。 
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21.8.1 提出 的 主要 问题 


本 章 提出 的 主要 问题 有 : 

。 适应 群体 在 许多 情况 下 是 必要 的 ， 如 互动 电视 、 智 能 环境 、 推 荐 旅游 团 等 。 在 场 
景 间 差 异 的 激励 下 ， 可 以 使 用 多 个 维度 对 组 推荐 进行 分 类 。 

。 许多 策略 是 为 了 聚合 个 人 偏好 ( 见 表 21. 3)， 其 中 有 的 策略 表现 比 其 他 策略 要 好 一 
些 。 用 户 似乎 关心 避免 损失 和 公平 性 。 

。 现 有 的 组 推荐 与 分 类 维度 中 和 聚合 策略 中 的 组 推荐 不 同 。 见 表 21. 9 的 概述 。 


表 21.9 组 推荐 系统 


分 类 
系统 应 用 场景 应 用 策略 
B NU TT 


根据 锻炼 的 项 目 为 健 
否 无 损 均值 


MUSICFX[15] 身 中 心 健身 的 人 选择 
| e [wm 





电台 


POLYLENS(17] 为 一 组 提供 电影 观看 | 是 | 
为 一 基于 子 组 (例如 ) 
INTRIGUE[2] 特征 的 组 用 户 提供 旅游 
景点 参观 


提供 一 个 共同 的 假期 


TRAVEL DECI- 








计划 所 需 属性 的 组 模型 是 中 位 数 
ION FORUM 
SION FORUM] | 并 争取 一 组 用 户 的 同意 | 
基于 多 属性 的 个 人 评 
YU's TV RECOM- 
UBI 分 为 一 组 用 户 提供 一 个 a 均值 
电视 节目 观看 


F's GR- 
户 选择 唱片 序列 


基于 推荐 节日 的 个 人 
满足 重要 需求 
CATS[16] 评价 帮助 用 户 选 择 一 个 
DER[10, 12] EB 
。 当 推荐 一 系列 物品 时 ， 在 序列 的 每 个 步骤 中 都 要 聚合 个 人 信息 ， 因 为 前 面 的 物品 
可 能 会 影响 后 面 物品 的 评分 。 
。 构建 满意 度 函 数 来 预测 单个 用 户 在 一 个 序列 中 的 任意 时 间 的 满意 度 是 可 行 的 。 然 
而 ， 组 互动 效果 (如 情绪 感染 和 整合 ) 会 使 该 过 程 变 得 复杂 。 
。 在 实验 中 评估 聚合 策略 和 满意 度 函 数 表现 如 何 是 可 行 的 ， 虽然 这 并 不 是 一 个 简单 
的 问题 。 
。 组 聚合 策略 不 仅 在 为 一 组 人 提供 推荐 时 是 重要 的 ， 也 可 以 用 于 个 人 推荐 ， 比 如 ， 
在 避免 冷 启动 问题 和 处 理 多 重 标准 时 。 


21.8.2 警告 : 组 建 模 


术语 “组 建 模 ”也 可 以 用 于 与 本 章 所 展示 的 完全 不 同 的 工作 中 。 组 成 员 之 间 的 常识 建 模 
(如 文献 [6，19]， 对 组 间 互 动 建 模 ( 如 文献 [18，5]) 和 基于 个 人 模型 的 群 组 构成 (如 文献 
[18，1])， 这 些 方面 已 经 开展 了 很 多 研究 。 
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21.8.3 面临 的 挑战 


相 比 个 人 推荐 的 工作 来 说 ， 组 推荐 仍 是 一 个 全 新 的 领域 。 本 章 介绍 的 工作 只 是 一 个 起 
Moped m 其 中 包括 : 


”致谢 


推荐 物品 序列 给 一 个 群 组 。 我 们 的 工作 似乎 是 目前 唯一 着 手 通过 均衡 序列 来 解决 
公平 问题 的 工作 。 即 使 序列 对 于 复杂 的 使 用 场景 是 重要 的 ， 其 工作 还 是 没有 研究 
序列 的 平衡 ， 也 没有 研究 序列 的 顺序 。 显 然 ， 在 推荐 和 顺序 序列 方面 还 需要 更 多 
的 研究 ， 尤 其 是 在 已 展示 的 物品 应 如 何 影响 其 他 物品 方面 。 其 中 一 些 研究 必须 在 
推荐 系统 的 特定 领域 进行 。 

情感 状态 的 建 模 。 这 里 仍 需 要 大 量 的 工作 去 获得 经 过 检验 的 满意 度 函 数 。 本 章 和 
文献 [12] 中 提出 的 工作 只 是 一 个 起 点 。 特 别 是 大 规模 评估 及 和 群 组 规模 的 影响 力 研 
究 是 必需 的 。 

聚合 策略 中 整合 情感 状态 。 正 如 21.6 节 所 示 ， 有 许多 方法 把 情感 状态 用 于 一 个 聚 
合 策略 中 。 我 们 提出 了 这 方面 的 一 些 初 步 想 法 ， 但 大 量 的 实证 研究 需要 进一步 深入 。 
组 推荐 的 解释 : 透明 度 和 隐私 。 有 人 可 能 认为 准确 预测 个 人 的 满意 度 能 改进 推荐 
系统 的 透明 度 : 显示 其 他 组 成 员 的 满意 度 能 提高 用 户 对 推荐 过 程 的 理解 ， 或 许 还 
可 以 使 得 用 户 更 容易 地 接受 他 们 不 喜欢 的 物品 。 然 而 ， 用 户 的 隐私 需求 很 可 能 与 
透明 度 需求 冲突 。 组 推荐 系统 的 一 项 重要 任务 是 避免 尴 众 。 用 户 一 般 喜 欢 与 组 成 
员 保 持 一 致 以 避免 被 不 喜欢 (正如 21. 5. 2 节 所 讨论 的 一 样 ， 其 他 组 成 员 的 情感 状 
态 如何 影 响 个 人 的 情感 状态 ) 。 在 文献 L[12] 中 ， 我 们 研究 不 同 的 组 聚合 策略 会 如 何 
影响 隐私 。 对 组 推荐 的 解释 还 需要 更 多 的 工作 ， 特 别 是 关于 如 何平 衡 透 明度 、 隐 
私 和 可 理解 度 。 第 15 章 提供 了 推荐 系统 中 不 同 角色 解释 的 详细 内 容 。 

用 户 界 面 设计 。 良 好 的 用 户 界 面 设计 会 增加 个 人 对 组 推荐 的 满意 度 。 例 如 ， 在 显 
一 个 物品 时 ， 可 以 给 用 户 显示 下 一 个 物品 (如 在 电视 节目 通过 字幕 告知 ) 。 这 可 
能 会 告知 用 户 谁 对 下 一 个 节目 兴趣 度 比 当 前 节目 更 大 一 点 。 

冷 启动 问题 的 组 聚合 策略 。 在 21. 7. 2 节 ， 我 们 简单 介绍 了 利用 组 聚合 策略 去 解决 
冷 启动 问题 。 然 而 ， 这 方面 的 研究 非常 少 ， 而 且 需 要 大 量 的 工作 去 验证 和 优化 这 
种 方法 。 

处 理 不 确定 性 。 在 本 章 中 ， 假 设 我 们 获得 了 准确 的 个 人 偏好 档案 。 例 如 ， 在 表 
21. 1 中 ， 推 荐 系统 明确 Peter 对 于 B 物品 的 评分 为 4。 然 而 在 现实 中 ， 我们 通常 面 
对 的 是 概率 数据 。 例 如 ， 我 们 认为 Peter 的 评分 有 80% 的 概率 为 4。 在 采用 聚合 策 
略 的 时 候 需 要 考虑 到 这 一 点 。DeCampos 等 试图 通过 使 用 贝 叶 斯 网 络 去 处 理 这 种 
不 确定 性 [4]。 然 而 ， 他 们 迄今 专注 于 平均 和 复数 投票 策略 的 研究 ， 尚 未 解决 避免 
损失 和 公平 性 问题 。 

实证 研究 。 为 了 推动 这 一 领域 的 前 进 ， 更 多 的 实证 评估 是 至 关 重 要 的 。 在 真实 环 
境 下 设计 一 套 容易 控制 且 能 大 规模 进行 的 实证 评估 是 我 们 面临 的 挑战 ， 特 别 是 在 
处 理 组 推荐 和 情感 状态 时 。 至 今 所 有 的 研究 (包括 我 自己 的 ) ， 仅 局 限 在 小 范围 内 ， 
且 都 是 人 为 的 设 定 或 缺乏 控制 。 


Judith Masthoff 的 部 分 研究 得 到 Nuffield 基金 会 的 支持 ，No. NAL/00258/G, 
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摘要 ”本章 对 聚合 函数 在 推荐 系统 中 的 应 用 进行 了 概述 。 类 似 于 算术 平均 值 等 简单 聚 
合 函数 在 聚合 用 户 特 征 、 物 品评 分 和 相似 性 指标 等 方面 得 到 了 广泛 应 用 ， 然而， 其 他 一 些 
聚合 函数 在 许多 系统 中 能 提供 更 高 的 精度 和 灵活 度 。 本 章 描 述 了 聚合 函数 在 推荐 领域 的 一 
些 重要 成 员 和 属性 的 定义 ， 以 及 成 熟 的 创建 方法 和 很 多 例子 。 


22.1 简介 


偏好 、 标 准 和 相似 性 的 聚合 贯穿 着 推荐 系统 的 许多 阶段 。 通 常 都 用 算术 平均 或 最 大 / 
最 小 函数 完成 聚合 ， 而 许多 能 够 为 更 多 相关 推荐 提供 灵活 性 和 适应 性 的 聚合 函数 常常 被 忽 
视 。 本 章 概述 了 聚合 函数 的 基本 知识 和 它们 的 属性 ， 介 绍 了 一 些 重要 的 成 员 ， 其 中 包括 平 
均值 (generalized mean), Choquet 与 Sugeno 积分 (Choquet and Sugeno integral) 、 有 序 加 
权 平 均 (ordered weighted averaging)、 三 角形 准则 (triangular norms and conorm) 以 及 双 极 
聚合 函数 (bipolar aggregation function), 。 类 似 的 方法 可 以 为 输入 、 连 接 、 取 消 连 接 和 混合 
行为 之 间 的 各 种 交互 进行 建 模 。 接 下 来 ， 我 们 将 介绍 基于 分 析 公 式 、 算 法 或 者 实验 数据 的 
不 同 的 聚合 函数 组 合 方式 。 讨 论 在 保留 重要 属性 的 同时 ， 如 何 使 聚合 函数 的 参数 符合 观测 
数据 。 通 过 使 用 更 复杂 适合 的 函数 代替 算术 平均 值 ， 消 除 输入 的 元 余 ， 可 以 改善 自动 推荐 
的 质量 ， 并 使 推荐 系统 适合 特定 的 领域 。 


22.2 推荐 系统 中 的 聚合 类 型 


总 体 来 说 ， 推 荐 系统 (RS) 引 导 用 户 在 经 过 电子 化 的 物体 和 信息 的 巨大 数据 库 中 找到 
自己 喜欢 的 物品 。 推 荐 系统 利用 大 量 的 用 户 特定 方案 生成 个 性 化 推荐 ， 其 个 性 化 物品 子 集 
展示 的 目标 在 概念 上 区 分 了 与 推荐 系统 类 似 的 方法 ， 如 互联 网 过 滤 。 从 出 现 开 始 ， 推 荐 系 
统 的 使 用 迅速 分 布 在 现 有 的 应 用 中 ， 例 如 ， 推 荐 电影 [34]、 网 页 L5]、 新 闻 [36]、 医 疗 
[14，31]、 音 乐 和 其 他 产品 [32，40]。 

很 明显 ， 用 来 推荐 物品 的 方案 依赖 特定 的 应 用 ， 以 及 数据 被 收集 和 在 系统 中 被 使 用 的 
方法 。 基 于 与 物品 特性 相关 的 方案 的 推荐 一 般 分 类 为 基于 内 容 的 推荐 (CB)， 而 利用 用 户 
相似 度 的 推荐 称 为 协同 过 滤 (CF)[1，2]。 进 一 步 将 基于 人 口 统计 的 过 滤 方 法 (DF) 、 基 于 
效用 的 (UB) 和 基于 知识 的 (KB)[16] 推 荐 方法 与 通常 使 用 物 一 物 相 似 度 的 内 容 推 荐 方法 区 
别 开 是 有 益 的 。 最 近 的 文献 的 特点 是 专注 于 混合 推荐 系统 (HS)， 它 结合 了 两 种 或 两 种 以 
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上 的 方法 。 

协同 过 滤 方 法 用 物品 偏好 或 者 相似 用 户 的 评分 作为 推荐 的 理由 。 这 种 类 型 的 推荐 一 直 
被 成 功 地 应 用 在 像 亚 马 逊 [32] 一 样 的 电子 商务 网 站 上 ， 其 中 通过 相似 的 品味 能 更 好 地 推断 
兴趣 ， 而 不 是 通过 模糊 的 主观 的 物品 描述 。 假 设 一 个 非 主流 类 别 ， 如 独立 音乐 ， 因 其 不 同 
于 主流 而 被 轻易 定义 。 由 于 流派 覆盖 范围 广泛 的 风格 ， 独 立 音乐 的 艺术 家 之 间 可 能 相似 性 
很 小 ， 除 了 他 们 的 粉丝 ? 。 聚 合 函 数 ( 一 般 为 简单 或 者 加 权 平 均 ) 经 常 被 用 来 聚合 评分 或 者 
相似 用 户 的 偏好 ， 然 而 它们 还 可 以 用 来 确定 用 户 相似 度 ， 帮 助 定 义 邻 居 ( 可 以 参照 本 书 的 
第 4 章 )。 

基于 内 容 的 过 滤 方 法 通过 匹配 物品 属性 与 用 户 信息 来 构造 方案 。 例 如 ， 一 个 新 闻 推 荐 
系统 可 能 会 为 每 个 拥有 关键 词 的 用 户 构建 用 户 信息 ， 对 未 知 物品 的 兴趣 可 以 通过 来 自 与 用 
户 信息 中 相对 应 的 故事 的 关键 词 来 预测 。 基 于 内 容 的 推荐 中 聚合 函数 的 使 用 方法 基于 每 个 
用 户 特 定 的 用 户 信息 特性 和 物品 描述 。 这 里 考虑 它们 在 物品 评分 计算 、 相 似 性 计算 和 用 户 
信息 构建 中 的 使 用 。 

人 口 统 计 过 滤 技 术 根 据 用 户 信息 为 每 个 用 户 分 配 一 个 人 口 统计 分 类 。 每 个 人 口 统计 分 
类 有 一 个 相关 的 用 户 原型 或 者 用 户 典型 用 来 为 推荐 构建 方案 。 与 物品 历史 不 同 ， 用 户 相 似 
度 更 可 能 是 由 用 户 个 人 信息 计算 得 来 的 ， 所 以 维度 比 大 多 数 协 同 过 滤 技 术 低 。 这 使 得 最 近 
邻 或 者 其 他 分 类 聚 类 方法 尤其 管用 。 

基于 效用 的 推荐 系统 并 不 构建 长 期 模型 而 是 匹配 物品 与 用 户 当前 的 需求 ， 并 考虑 他 们 
的 普遍 倾向 和 偏好 。 例 如 ， 一 个 用 户 正在 寻找 一 本 特定 的 书 ， 从 用 户 的 过 去 行为 中 已 知 其 
偏爱 旧 精 装 版 ， 即 使 需要 花 很 长 时 间 才 能 买 到 。 在 基于 内 容 过 滤 的 情况 下 ， 系 统 中 描述 物 
品 可 以 根据 其 特性 ， 更 具体 的 是 与 特性 相关 的 效用 。 由 于 是 基于 内 容 的 过 滤 ， 即 使 用 户 信 
息 和 系统 信息 都 可 能 不 同 ， 仍 然 可 以 应 用 聚合 函数 。 

基于 知识 的 推荐 系统 使 用 相关 和 类 似 物品 的 背景 知识 推断 用 户 的 需求 以 及 如 何 最 大 化 
满足 他 们 的 需求 。 基 于 知识 的 方法 并 不 仅 利 用 典型 的 相似 性 方法 ， 如 相关 性 ， 还 利用 了 用 
户 可 能 感 兴趣 的 属性 相似 性 。 例 如 ， 当 用 户 表明 他 喜欢 电影 A Good Year， 基 于 知识 的 推 
荐 系统 可 能 会 将 其 与 电影 A Beautiful Mind( 也 是 由 Russell Crowe 主演 的 ) 或 者 Jeux d' 
Enfants( 也 是 由 Marion Cotillard 主演 的 ) 相 关联 。 由 于 历史 表明 用 户 偏好 法 国电 影 ， 系 统 
会 推断 该 用 户 喜 欢 由 Marion Cotillard 主演 的 电影 A Good Year， 并 做 出 相应 的 推荐 。 
[16j 中 指出 基于 知识 的 推荐 系统 经 常 借鉴 基于 用 例 的 推理 方法 。 

混合 推荐 系统 用 来 克服 每 个 推荐 方法 自身 的 缺陷，Burke[16] 将 其 分 类 为 加 权 型 、 合 
并 型 、 转 换 型 、 特 征 组 合 型 、 级 联 型 、 特 征 递增 型 、 元 层次 型 。 聚 合 函 数 也 可 以 用 在 混合 
过 程 中 。 例 如 ， 组 合 加 权 型 混合 推荐 中 不 同 的 推荐 分 数 或 特征 组 合 型 混合 推荐 中 的 特征 。 
另外 ， 其 中 一 些 混合 推荐 方法 对 于 在 不 同 阶段 使 用 的 聚合 函数 执行 的 改善 有 很 大 帮助 。 例 
如 ， 瀑 布 型 方法 使 用 其 中 一 个 过 滤 技 术 来 减少 数据 集 的 大 小 ， 而 特征 递增 型 混合 推荐 可 能 
使 用 其 中 一 种 方法 来 降 维 。 协 同 过 滤 推 荐 使 用 的 相似 性 方法 可 以 使 用 在 基于 效用 和 内 容 的 
推荐 框架 中 构建 的 用 户 特 定 聚 合 函数 (如 权重 与 参数 之 间 的 相似 性 )。 相 似 的 元 层次 型 混合 
推荐 在 文献 [16] 中 有 描述 。 转 换 型 混合 推荐 的 转换 标准 在 一 定 程度 上 可 能 会 用 到 聚合 函 
数 ， 然 而 ， 合 并 型 混合 推荐 就 很 少 用 到 了 。 


加 ”有趣 的 是 ， 独 立 音乐 的 粉丝 因 缺 乏 流行 文化 与 消费 主义 的 一 致 性 ， 容易 成 为 使 用 协同 过 波 推 荐 的 电子 商务 
网 站 的 市 场 目标 。 最 近 的 一 篇 文献 [26] 中 有 描述 。 
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聚合 函数 需要 多 个 输入 并 将 它们 合并 为 一 个 代表 性 的 输出 。 关 于 聚合 函数 的 简单 例 
子 ， 包 括 算术 平均 值 、 中 位 数 、 最 大 最 小 值 。 在 推荐 系统 中 使 用 更 复杂 和 更 具 表 达 性 的 方 
法 通常 的 动机 是 更 准确 地 推荐 ， 然 而 ， 在 某 些 情况 下 与 其 他 数据 处 理 方法 相 比 ， 聚 合 函数 
是 比较 实用 的 选择 。 在 接 下 来 的 小 节 中 我 们 将 调查 聚合 函数 在 不 同类 型 的 推荐 系统 中 扮演 
的 角色 ， 这 些 角色 可 以 显示 它们 可 以 被 用 在 哪里 以 及 已 经 应 用 在 了 哪里 。 


22.2.1 协同 过 滤 中 的 偏好 聚合 


给 定 一 个 用 户 u 和 相似 用 户 的 邻居 U= (us uz, ts u), HP u XERA H i AAF 
可 以 通过 聚合 给 定 的 分 数 进行 预测 。 我 们 用 R(u，d;) 来 表示 兴趣 、 评 分 或 偏好 的 预测 
程度 : 


k 
R(u,d;) = M isimG,uj R(u; d) (22. 1) 


该 方程 式 称 为 加 权 算术 平均 (WAM)， 其 中 用 户 与 其 相似 用 户 的 相似 度 simu, wj) =w 是 
权重 ， RG;, d;)—z; 是 要 聚合 的 输入 。 给 定 Us» Zi 之 0， R(u, di), 是 一 个 聚合 函数 。 
选择 WAM 容易 解释 ， 可 以 满足 许多 有 用 的 属性 并 且 在 计算 成 本 低 的 同时 ， 其 他 的 聚合 函 
数 包括 寡 均 值 ( 可 以 是 非 线性 ?或 者 Choquet 积分 (针对 相关 输入 ) 可 能 会 更 精确 地 预测 用 户 
评分 。 


22.2.2 CB 与 UB 推荐 中 的 特性 聚合 


配置 文件 可 表示 为 特性 偏好 向 量 P, 二 (p11，…，p,)， 物 品 的 描述 可 以 根据 物品 满足 
特性 的 程度 ， 如 d; 二 (zx1，…，z,)。 此 时 ,zj 三 1 表示 该 物品 完全 满足 偏好 。 也 可 以 是 一 
个 关键 字 向 量 ， 在 此 情况 下 zj 二 1 仅 表 示 关 键 词 只 出 现 一 次 。 一 个 物品 的 整体 得 分 Ru, 
d EH r; 的 聚合 决定 : 
Rlu, di)=f(zx1, t, x) (22. 2) 
式 (22. 2) 是 一 个 聚合 函数 ， 该 函数 提供 满足 特定 边界 条 件 的 方法 ， 且 相对 于 zi 的 增加 是 
单调 的 。R(u，d;) 分 数 可 以 用 来 排名 后 面 要 推荐 的 未 知 物品 。 如 果 推 荐 系统 只 允许 展示 一 
个 物品 ， 那 么 如 何 评 估 该 评分 及 其 原因 都 变 得 很 重要 。 如 果 用 户 只 想 购买 或 浏览 满足 他 们 
所 有 偏好 的 物品 ， 那 么 应 该 使 用 像 最 小 化 一 样 的 合 取 函 数 。 另 一 方面 ， 如 果 其 中 一 些 偏好 
不 能 同时 满足 ， 例 如 ， 用 户 对 戏剧 和 恺 怖 片 感 兴趣 ， 那 么 平均 函数 或 析 取 函数 可 能 比较 可 
靠 。 我 们 将 在 22.3 节 举 出 很 多 这 种 聚合 函数 广泛 分 类 的 例子 。 
在 计算 物品 与 物品 相似 度 可 行 的 情况 下 ， 基 于 内 容 的 过 滤液 可 以 使 用 与 协同 过 滤 相 对 
应 的 方法 [2]。 在 这 种 情况 下 ， 用 户 信息 可 能 包含 所 有 或 一 部 分 之 前 评分 /购买 的 物品 D= 
{di，…，d,}， 相 似 性 在 未 知 物品 d, 和 中 的 物品 中 进行 计算 : 
R(u,d;) = >) sim(d;,d;)R(usd;) (22. 3) 
在 这 种 情况 下 ， 基 于 内 容 的 方法 可 以 受益 于 使 用 聚合 函数 来 确定 物品 相似 度 和 在 22. 2. 4 
节 中 提 到 的 物品 邻居 。 
22.2.3 CB 5 UB 的 配置 文件 构建 


更 复杂 的 系统 将 为 每 个 偏好 分 配 一 个 权重 。 为 了 加 强 在 线 体验 ， 许 多 推荐 系统 趋向 于 
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从 在 线 行为 中 学 习 偏 好 (和 权重 ) ， 而 不 是 要 求 用 户 显 式 地 表达 。 之 前 评分 或 购买 的 物品 的 
特性 可 以 聚合 成 为 每 个 偏好 的 整体 得 分 。 给 定 一 个 偏好 p;， 让 zi 为 物品 d; 满足 p; HE 
度 ， 那 么 分 数 w(p;) 可 以 表示 为 

w(p)-—fn;j, ts Zy) : (22. 4) 
一 旦 确定 了 所 有 的 偏好 ，w(p;) 就 可 以 用 来 确定 ww ， 用 于 计算 式 (22. 2). 


22.2.4 ”物品 和 用 户 相似 度 以 及 邻居 的 形成 


使 用 式 (22. 1) 的 推荐 行为 和 准确 率 将 很 大 程度 上 依赖 相似 度 是 如 何 确定 的 (加 权 向 
量 ) 。 用 户 之 间 的 相似 度 可 以 通过 之 前 评分 或 购买 的 物品 来 计算 ， 或 者 利用 与 用 户 相关 的 
已 知 特性 进行 计算 ， 如 年 龄 、 位 置 和 用 户 已 知 的 兴趣 。 最 常用 的 计算 相似 性 的 方法 ， 如 式 
(22. 1) 中 的 加 权 ， 使 用 了 余弦 计算 [39]j 和 皮尔 逊 相关 系数 [36]j。 最 近 ， 其 他 相似 性 计算 方 
法 相继 出 现 ， 像 模糊 距离 [4] 和 基于 用 户 评分 分 布 的 (可 以 参照 本 书 第 4 章 ) 其 他 特定 推荐 
指标 [18，3j。 

如 式 (22. 1) 也 可 以 考虑 用 在 最 近邻 (kKNN) 方 法 的 框架 中 。 聚 合 函 数 已 被 用 于 提高 最 
近邻 规则 的 精确 性 和 效率 ， 同 时 OWA 和 Choquet 积分 为 框架 提供 模拟 衰减 权重 和 邻居 
交互 的 功能 [45，12]。 在 最 近邻 设置 中 ， 相 似 性 无 异 于 多 维 近似 或 距离 。 欧 几 里 得 距离 
用 于 计算 在 文献 [42] 中 使 用 评分 和 个 人 信息 作为 输入 的 推荐 系统 的 相似 度 。 欧 几 里 得 距 
离 只 是 一 种 类 型 的 度量 ， 可 能 不 能 很 好 地 捕捉 到 距离 的 概念 ， 例 如 ， 数 据 维度 之 间 在 某 
种 程度 上 是 相关 的 甚至 是 不 可 比较 的 。 在 某 些 聚合 函数 的 帮助 下 定义 的 指标 包括 OWA 
算 子 和 Choquet 积分 ， 已 经 在 文献 [41，13] 中 探讨 ， 并 可 能 在 计算 某 些 推荐 系统 的 相似 
性 时 有 用 。 

如 果 将 式 (22. 1) 中 的 sim(u，w) 看 作 权重 而 不 是 相似 度 ， 那 么 我 们 可 以 认为 各 种 聚合 
函数 的 权重 确定 问题 已 经 被 广泛 研究 。 一 个 方法 是 通过 最 小 二 乘法 拟 合 技 术 从 数据 子 集中 
学 习 权重 。 例 如 ， 给 定 一 组 交互 评分 物品 D={(d ，…，d)，WAM 的 权重 可 以 由 下 式 来 
模拟 : 


q k 
minimize >) (R(u,di) 一 X wR Cu; ;d;) ) 
i=1 j=l 


iw = 1 
真正 被 确定 的 是 可 最 小 化 剩余 误差 的 权重 向 量 w= 二 (wi ，…，w)。 那 么 其 中 每 个 权重 就 是 
在 精确 预测 R(w，d;) 时 给 定 用 户 的 重要 性 。 非 线性 函数 ， 如 加 权 几 何平 均 ， 也 可 以 用 这 
种 方法 模拟 。 该 算法 因 其 计算 时 间 效 率 相对 较 高 ， 且 可 以 由 离线 计算 得 到 或 者 在 运行 时 根 
据 推荐 系统 和 数据 集 大 小 计算 获得 。 
另外 ， 聚 合 函数 可 以 用 来 组 合 不 同 的 相似 性 计算 方法 。 给 定 一 些 数量 的 相似 性 计算 方 
法 sim; (u, uj), sims Cu, wu)» ，…，sim, (u，t) 等 ， 可 以 获得 一 个 整体 的 相似 性 计算 方 
法 9S 。 此 类 聚合 相似 度 在 文献 [20] 中 用 来 推荐 电影 。 在 此 例 中 ,余弦 与 相关 性 得 分 通过 该 
方法 进行 结合 ， 该 方法 是 非 线性 结合 的 聚合 函数 。 


O ”针对 基于 多 重 标准 的 相似 度 ， 参 见 第 24 章 。 
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22.2.5 基于 实例 推理 的 连接 词 在 推荐 系统 中 的 应 用 


在 模糊 集 社 区 许多 研究 者 的 方法 是 基于 用 例 推理 [23] 来 构建 推荐 问题 的 ， 其 中 聚合 函 

数 可 以 作为 连接 词 。 这 导致 了 如 下 的 形式 规则 : 
If da is A; AND d; is A; OR:-:d, is A, THEN… (22. 5) 

mi, Zoo s Ia 表示 规则 判断 di 是 A 等 的 满足 程度 ， 而 聚合 函数 用 来 代替 AND 和 OR 
操作 。 例 如 ， 若 一 个 用 户 的 属性 显示 一 个 对 喜剧 与 动作 片 的 偏好 ， 那 么 该 用 户 的 推荐 规则 
可 能 包括 “如 果 该 电影 是 喜剧 或 者 动作 片 ， 那 么 推荐 它 ” 。 每 个 风格 都 可 以 表示 为 一 个 具 
有 模糊 链接 的 模糊 集 ， 用 来 聚合 满足 度 。OR 和 AND 行为 通常 分 别 由 析 取 和 合 取 聚合 函 
数 建 模 。 在 推荐 系统 中 ， 可 以 看 出 巨大 的 加 强 的 特性 是 可 取 的 [44，9]。 着 有 和 需要， 这 个 
特性 允许 进行 多 种 大 幅 有 效 调整 生成 一 个 健壮 的 推荐 系统 ， 或 者 许多 微小 的 调整 来 减少 
推荐 。 

构建 式 (22. 5) 的 方法 可 以 用 于 CB、UB 和 KB 中 物品 与 配置 文件 或 队列 的 匹配 。 在 某 
些 基于 人 口 的 推荐 系统 中 ， 在 一 个 给 定 的 类 中 ， 物 品 基本 上 会 推荐 给 每 个 人 ， 这 使 得 分 类 
过 程 为 该 推荐 系统 的 首要 任务 。 根 据 用 户 满足 若干 原型 的 程度 将 用 户 分 类 是 可 取 的 ， 反 过 
来 可 以 根据 用 户 对 每 个 物品 的 兴趣 来 描述 物品 。 例 如 ， 一 个 免 息 的 个 人 贷款 会 非常 吸引 大 
学 生 ， 对 新 手 妈妈 也 会 有 些 吸 引 ， 但 是 对 新 婚 燕 尔 可 能 就 没什么 吸引 力 了 。 如 果 系 统 聚 合 
了 每 个 人 口 信息 的 兴趣 值 ， 用 户 可 能 会 部 分 满足 每 个 原型 。 这 导致 了 类 似 式 (22.5) 的 规 
W. "IF 物品 对 于 学 生 感 兴趣 OR 对 于 新 手 妈 妈 感 兴趣 ， 那 么 用 户 u 也 将 对 其 感 兴趣 ”， 或 
者 “如 果 用 是 未 婚 而 且 要 么 是 学 生 要 么 是 妈妈 ， 那 么 为 其 推荐 该 物品 ”。 


22.2.6 加 权 混 合 系 统 


给 定 一 组 通过 不 同方 法 得 到 的 推荐 分 数 ， 例 如 ，RCF(u，4d;)，RCB(u，d;) 等 ， 整 体 
得 分 可 以 通过 使 用 聚合 函数 f 得 到 : 
Rlu, doc futu, di), Reus di), =) (22. 6) 
P-Tango 系统 [19] 使 用 协同 过 滤 与 基于 内 容 得 分 的 线性 组 合 进行 推荐 ， 而 且 根据 推断 出 的 
用 户 偏 好 来 调整 权重 。 两 个 或 多 个 方法 的 聚合 可 以 通过 使 用 多 种 不 同属 性 和 行为 的 方法 来 
执行 。 使 用 非 线性 或 者 更 加 复杂 的 方法 可 以 优化 某 些 推荐 系统 的 排名 过 程 ， 产 生 非 相关 性 
更 小 、 精 确 度 更 高 的 预测 。 


22.3 聚合 函数 概论 

聚合 函数 的 目的 是 组 合 输入 ， 这 些 输入 一 般 被 表示 为 在 模糊 集中 的 关系 度 、 偏 好 度 、 
证 据 强 度 或 假设 的 支持 度 等 。 本 节 将 在 介绍 一 些 广为人知 的 成 员 之 前 先 提供 一 些 初步 的 
定义 。 | 
22.3.1 定义 和 属性 

我 们 要 考虑 的 是 定义 在 单元 区 间 的 聚合 函数 f: [0，1]" 一 [0，1]， 但 是 其 选择 也 是 可 


O 我 们 在 此 也 要 注 明 这 样 的 规则 可 以 用 于 任何 推荐 系统 来 决定 何 时 推荐 物品 ， 比 如 ,“ 如 果 用 户 不 活跃 ， 则 推 
荐 某 个 东西 ”。 
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能 的 。 输 入 为 0 表示 没有 关系 、 偏 好 、 证 据 、 满 足 等 ， 自 然 n 个 0 的 聚合 结果 为 0。 同样 
地 ， 值 1 表示 完全 关系 (最 强 程度 的 偏好 和 证 据 )，1 的 聚合 结果 自然 为 1。 

聚合 函数 还 需要 在 每 个 参数 上 单调 ， 即 输入 的 增加 并 不 能 降低 整体 分 数 。 

(聚合 函数 ) 聚合 函数 是 7 二 1 个 参数 从 (7 维 ) 单 元 立方 到 单元 区 间 的 映 
St f: [0，]]" 一 [0，1]， 并 具有 以 下 属性 : 

(|1)F(0，0，…，0) 王 0 and f (1, le, 1)=1 

一 一 -一 一 一 一 -一 

(ii )x<y implies f(x)<f(y)for all x, ye[0, 1J” 

对 于 某 些 应 用 ， 输 入 可 能 具有 各 种 组 成 部 分 (例如 ， 一 些 值 可 能 会 缺失 )。 特 别 是 在 自 
动 系统 情况 下 ， 可 能 希望 使 用 在 "一 2，3，… 个 基本 属性 相同 的 参数 上 定义 的 功能 来 提供 
一 致 的 聚合 结果 。 然 后 ， 符 合 下 列 定义 L33j 的 功能 才 值 得 考虑 。 

(扩展 聚合 函数 ) 扩展 聚合 函数 是 如 下 一 个 映射 

Ul. i-o, 1] 
该 映射 到 具有 确定 n 值 的 域 [0，1]” 上 的 限制 是 一 个 n URB GRE f£. XT n—lgs 
F(x)=<. 

聚合 函数 分 类 取决 于 它们 与 输入 之 间 关 系 的 整体 表现 L17，21，22]j。 在 某 些 情况 下 我 
们 需要 高 输入 来 补偿 低 输入 ， 或 者 可 以 平均 相互 输入 。 在 其 他 情况 下 ， 这 样 做 是 有 意义 
的 ， 高 分 数 互相 加 强 而 低 分 数 基本 上 被 丢弃 。 

(分 类 ) ”聚合 函数 f: [0, 1]"-—[0, 1]: 

平均 如 果 边 界 为 min(x)< f(x)<max(x); 

合 取 如 果 边 界 为 f(x)<min(x); 

析 取 如 果 边 界 为 FCxz) 之 max(Cx); 

混合 其 他 情况 下 。 

聚合 函数 的 分 类 取决 于 推荐 系统 的 输入 是 如 何 表示 的 ， 以 及 输出 需要 的 灵敏 度 或 广泛 
性 。 当 在 CF 中 聚合 推荐 得 分 时 ， 使 用 聚合 函数 保证 了 物品 的 兴趣 预测 代表 分 数 的 总 体 趋 
势 。 另 一 方面 ， 某 些 混合 聚合 函数 的 语义 让 它们 更 可 能 被 使 用 。 例 如 ，MYCINL14] 是 一 
个 典型 的 专家 系统 ， 用 来 诊断 和 治疗 稀有 的 血液 疾病 ， 使 用 了 一 个 混合 聚合 函数 ， 因 此 高 
得 分 输入 互相 加 强 ， 而 得 分 低 于 某 一 阔 值 的 输入 被 惩罚 。 

聚合 函数 可 以 满足 多 种 研究 过 的 属性 ， 使 得 它们 可 以 在 某 种 情况 下 有 用 处 。 这 里 我 们 
提供 那些 文献 中 经 常 引 用 的 定义 。 

[属性 ] 聚合 函数 f. [0, 1 —[0, 1]; 

BE deXxT4M^i€c[Oo, 1M fO, t, s, O=t; 

对 称 如 果 其 值 不 依赖 参数 的 排列 ， 例 如 ， 对 于 fx xoc o m2— fIGxs 
Xp(2)，*…，ZXpin ) 每 个 Xx 及 (1，2,，…，n) 的 每 个 排列 P—COPOD, POD, ++, Pln)); 

关联 ”如果 对 于 f: [0，1]* 一 [0，1],， 在 所 有 zi， mox bffin:mnm.m)- 
fGis Fes Zz3)) 不 变 ; 


平移 不 变 如 果 对 于 所 有 A€[^1. 1] ] 和 X 一 (2Z1， Ter Xa)» AOT seg 
(x, +ay€[0, 1 并 且 f GO -A€[0, 1], MARK (zi 十 4，…，Zxs 十 4) 二 (x) 十 A RÀ, 
FR eX TOR A€LO. lf x— Gn, rs ono 公式 fans rs AT) =Af(x) 


成 立 ; 
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严格 单调 ”如果 x 三 y 但 x 关 y， 则 fK fly); 

Lipschitz 连续 ”如 果 存 在 整数 M， 对 于 任意 两 个 输入 x，yE[L0，1]"， 公 式 | f(x) 一 
f(y)| 二 Ms(x，y) 成 立 ， 其 中 dox, y Ex, y 之 间 的 距离 。M 的 最 小 值 叫 作 了 的 Lips- 
chitz 常数 ; 

具有 中 立 元 素 “如果 存在 一 个 eE[0，1] 使 得 对 于 任何 位 置 的 1ELO0，1] 有 fle, s 
Cy ty e, 0*7, e)5t; 

R8 deX44—^ac[o., D014&43 5p T4£€ x Brj=a A frs c7 mj 
Ay arr Ay In) =a 
22. 3. 1. 1 Rs 中 的 实用 注意 事项 

阐述 许多 重要 并 且 被 广泛 研究 聚合 函数 的 正式 定义 之 前 ， 我 们 先 通过 一 些 例子 来 讨论 
其 中 每 个 属性 的 某 些 影响 。 

寡 等 ”所 有 平均 聚合 函数 包括 22. 3. 2 节 所 定义 的 均值 、OWA 和 Choquet $121 ai R 
等 的 9 。 

通常 该 属性 的 解释 趋向 于 解释 为 输入 之 间 的 一 致 性 。 然 而 在 某 些 RS 应 用 中 ， 例 如 ， 
在 CF 聚合 评分 时 ， 物 品 相对 排名 比 输入 /输出 解释 的 通 约 性 更 重要 。 

JLE Gr, y) = Vry ERR, MAR T,(r—y)—2xy KERF. X 
于 任意 两 个 对 象 di 二 (zi， y) M d=, y), Æ Gdi) >G(d,) WHH T, (di) = 
Th. < 

取 d,—(0.5, 0.5), d,=(0.2, 0.8). HAL PRU RARKREA AE 
Hy) G(d,)=0.5, G(d;)—0.4, TP(d,)=0.25, TP(d;)-0.16, WẸ d; 是 CF 中 的 物品 
得 分 ， 在 使 用 G 的 情况 下 ， 最 好 将 输出 解释 为 用 户 u 的 预测 评分 。 如 果 d; 是 UB 过 滤 中 
通过 满足 两 个 用 户 偏 好 的 满足 度 进行 的 物品 描述 ， 那 么 能 更 好 地 表示 整个 用 例 ， 因 为 我 们 
希望 满足 大 多 数 偏好 。 4 

对 称 性 ”对 称 性 经 常用 来 表示 相关 输入 的 同等 重要 性 。 加 权 或 未 加 权 的 准 算术 平均 值 
可 根据 情况 使 用 。 虽 然 有 序 加 权 平 均 函 数 (OWA) 是 根据 加 权 向 量 定义 的 ， 但 输入 经 过 了 
非 递 增 地 预 排 序 ， 因 此 它 的 对 称 性 与 w 无 关 。 

协同 RS 认为 一 个 物品 由 三 个 相似 的 用 户 心 =(0.2，0.7，0.5) 进 行 评分 。 
我 们 考虑 使 用 OWA 函数 或 加 权 算 数 平均 (WAM) 加 权 向 量 w=(0.6，0.3，0.1)。 假 设 使 
用 WAM， 权 重 表示 用 户 u SAP wu 之 间 很 相似 ， 进 一 步 有 simlu, ui) simQu, uu) 
sim(u，us)。 因 为 用 户 u 不 是 特别 喜欢 该 物品 ， 在 这 种 情况 下 的 聚合 分 数 为 R(u，d;)= 
WAM(d;) =0. 6(0. 2) +0. 3(0.7) 十 0.1(0.5)==0.38。 如 果 使 用 OWA， 权 重 的 一 个 解释 是 
如 果 有 一 个 或 者 两 个 相似 用 户 喜 欢 该 物品 那么 用 户 u 也 会 喜欢 ， 不 管 哪个 相似 用 户 喜 欢 。 
那么 有 Ru, d;)=OWA(d;) =0. 6(0. 7) +0. 3(0.5) 十 0. 1(0. 2) —0. 59, 4 

关联 性 ”关联 性 对 于 自动 计算 有 所 帮助 ， 因 为 它 允 许 函数 在 任何 维度 递归 的 定义 。 这 
对 协同 RS 的 稀疏 性 问题 可 能 有 用 。 同 样 的 函数 可 能 用 来 评估 一 个 由 10 个 相似 用 户 评分 的 
物品 以 及 被 1000 个 相似 用 户 评分 的 另 一 个 物品 。 三 角 模 型 和 三 角 余 模型 、 统 一 模型 和 零 
模型 都 是 关联 的 ， 但 是 准 算术 平均 值 方法 不 是 关联 的 。 


O 因为 单调 性 的 要 求 ， 圭 等 性 和 求 均 的 做 法 对 于 聚合 函数 是 等 价 的 。 这 个 属性 有 时 可 以 看 作 一 致 性 ， 因 为 当 
输入 全 体 一 致 时 ， 输 出 和 每 个 输入 相同 。 
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CEDE 一 个 协同 过 滤 RS 使 用 个 人 信息 来 确定 两 个 用 户 之 间 的 相似 性 (例如 ， 不 需 
要 在 每 次 一 个 新 物品 被 评分 时 重新 估计 值 )。 系 统 并 没有 为 每 个 用 户 存 储 一 个 物品 与 用 户 
的 矩阵 ， 而 是 使 用 一 个 统一 模型 U(xz，y) 来 聚合 相似 用 户 的 评分 ， 存储 一 个 聚合 的 物品 评 
分 d=(U(d)，…，U(d,)) 的 单一 向 量 。 当 添加 了 一 个 新 物品 评分 r RARE 
U(U(d)，zi ) 并 代替 U(d,) 进 行 保 存 。 好 处 是 在 更 新 预测 评分 时 ， 不 需要 知道 之 前 的 得 
分 及 物品 被 评分 的 次 数 。 4 

平移 不 变性 和 均匀 性 平移 不 变性 和 均匀 性 方法 的 主要 好 处 是 转化 或 扩大 研究 领域 并 
不 会 影响 聚合 输入 的 相对 顺序 。 加 权 算术 平均 值 、OWA、Choquet 积分 都 是 平移 不 变 的 ， 
因此 只 要 输入 是 可 比较 的 ， 不 管 输入 是 在 文献 [0，100] 还 是 文献 [1，7] 上 都 没有 影响 。 

严格 单调 性 ”严格 单调 性 用 在 给 可 用 来 显示 给 用 户 的 物品 有 限 的 应 用 中 。 当 w>0, 
V, 时 ， 加 权 算术 平均 和 OWA 函数 是 严格 单调 的 ， 而 算术 平均 和 调和 平均 方法 在 x 上 是 
严格 的 。 不 严格 的 聚合 函数 ， 如 最 大 化 方法 ， 不 能 区 分 物品 di — (0. 3，0. 8) 和 物品 d, — 
(0,8, 0,8), 

GEB 一 个 度假 推荐 网 站 使 用 基于 效用 的 RS， 其 中 Lukasiewicz ARER SLE, y)= 
min(z 十 y，1) 用 来 聚合 物品 特性 。 通 过 邮件 通知 用 户 每 个 SLCd)=1 的 物品 是 可 以 的 。 
d, —(0.3, 0. 8) 还 是 d, —(0.8, 0. 8) 是 没关系 的 ， 因 为 二 者 的 预测 完全 满足 用 户 的 需求 。 

< 

Lipschitz 连续 “一 般 而 言 ， 连 续 性 保证 了 输入 的 小 误差 不 会 导致 输出 的 急剧 变化 。 该 
特性 在 输入 不 管 是 物品 描述 还 是 用 户 评分 不 精确 的 推荐 系统 中 尤其 重要 。 一 些 函 数 只 违反 
这 个 属性 领域 的 一 小 部 分 (参照 例 22. 6) 。 只 要 在 考虑 推荐 得 分 时 考虑 该 特性 ， 该 函数 可 能 
依然 适合 。 | 

GERAD 算术 平均 方法 G(xz，y) = Vzy 不 如 Lipschitz 特性 ， 因 为 当 一 个 输入 接近 0 


时 ， 变 化 率 是 没有 边界 的 。 另外， 调和 平均 数 方法 H, V= (在 二 元 实例 中 ) 是 


Lipschitz 连续 的 ， 其 中 Lipschitz 常数 M—2, 4 

中 立 性 和 吸附 性 元 素 ， 吸 附 性 元 素 在 RS 中 可 保证 某 些 物品 经 常 或 永 不 被 推荐 。 例 如 ， 
一 个 UB 推荐 系统 可 以 移 除 每 一 个 特性 得 分 为 0 的 物品 ， 或 者 明确 地 推荐 完全 符合 用 户 某 
个 偏好 的 物品 。 三 角 模 型 或 三 角 余 模型 都 具有 吸附 性 元 素 。 将 具有 中 立 性 元 素 的 函数 组 合 
到 聚合 用 户 评分 的 推荐 系统 中 (CF 或 者 CB 架构 中 ) 人 允许 指定 不 会 影响 推荐 分 数 的 值 。 例 
如 ， 许 多 人 都 喜欢 的 一 部 电影 其 得 到 称赞 的 整体 评分 会 因 一 个 不 怎么 喜欢 但 依然 被 要 求 评 
分 的 用 户 的 评分 而 降低 。 如 果 存 在 一 个 中 立 值 ， 该 评分 就 不 会 影响 聚合 分 数 。 


22.3.2 RARA 


22.3.2.1 准 算术 平均 值 
加 权 准 算术 平均 方法 成 员 包括 寡 平 均值 ， 这 反 过 来 包括 了 其 他 典型 的 均值 方法 ， 如 算 
术 和 几何 平均 的 特殊 用 例 ( 可 以 参照 文献 [15] 中 的 方法 概述 ) 。 
(加 权 准 算术 平均 ) 给 定 一 个 严格 单调 且 在 g: [0, 1] [— 99, to]. 
连续 被 称 为 生成 函数 或 生成 器 的 函数 以 及 一 个 权重 向 量 wH Cw ，…，zu)， 加 权 准 算术 平 
均值 为 


Mna (x) = g” (Sd) wg (z;)) (22.7) 
i=1 
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其 中 Dw 一 1 且 任 给 ) 有 mi 之 0Vi 。 


算术 平均 WAM, = Dd) wiz; g(t) = t; 
j=l 


几何 平均 G, = ie jg) = log(t) ; 
j=l 


Ww 


调和 平均 H, = (3 my", go =>; 


RH Myc = (Ss) ). gut; 


术语 平均 值 通常 用 来 表示 平均 行为 。 准 算术 平均 值 依 据 一 个 对 所 有 w; m 1/n 要 么 对 称 
要 么 不 对 称 的 权重 向 量 来 定义 。 通 常 给 一 个 特定 的 输入 分 配 一 个 权重 表明 了 这 个 特定 输入 
的 重要 性 。 所 有 需 平 均 方法 (包括 WAM., G 和 H,) 在 闭 区 间 [0，1]" AES, E 
的 、 严 格 单调 的 ， 但 是 只 有 加 权 算 术 平 均 是 平移 不 变 的 。 几 何平 均 是 非 Lipschitz 连续 
的 5, 
22.3.2.2 OWA 函数 


有 序 加 权 平 均 函 数 (OWA) 也 是 平均 聚合 函数 ， 它 并 没有 将 权重 与 一 个 特定 的 输入 结 
合 ， 而 是 跟 与 其 他 输入 的 相对 值 或 顺序 相 结合 。Yager[L43] 对 此 有 介绍 而 且 在 模糊 集 社 区 
非常 流行 。 

(OWA) 给 定 一 个 权重 向 量 w，OWA 函数 如 下 


OWA,(x) — uro 


其 中 (. ) 符 号 代表 组 成 部 分 x vA ak ub NR a > x(2) > Sx(n) HSI, 

依据 权重 向 量 w，OWA 操作 的 特殊 分 类 包括 : 

算术 平均 所 有 的 权重 相等 例如，w 二 1/n; 

最 大 化 函数 ”其 中 w= 二 (1,，0,，…，0); 

最 小 化 函数 ”其 中 w= 二 (0,，…，0，1); 

中 位 数 函 数 ” 其 中 w= 二 0， 所 有 j 了 关 m， 如 果 n 二 2m 十 1 是 奇数 ， 则 v,—1, HP w= 
0， 所 有 jum, mol. wRn=2m 是 偶数 ， 则 wn 二 wn 十 1 二 0. 5; 

OWA dh 4& J£ — ^- 2r HALE AE REA BH, wR TEE | Aw, 0, RJ OWA 是 对 
AA, JG. FBR RH, Lipschitz 连续 的 和 严格 单调 的 。 
22.3.2.3  Choquet 与 Sugeno 积分 


Choquet 和 Sugeno 积分 被 称 为 模糊 积分 是 依据 一 个 模糊 度量 定义 的 平均 聚合 函数 。 
其 在 构建 输入 值 x; 间 的 交互 中 有 用 。 

(模糊 度量 ) 给 定 V 一 {1，2，…，m}。 一 个 离散 的 模糊 度量 是 在 ui 
2w 一 [0，1] 上 单调 (如 当 ACB tt v(A)<v(B)) 89, 而且 满足 v($) 二 0 和 wv(N) 二 1 的 集合 
方法 。 给 定 任意 两 个 集合 A，BCN， 模 糊 度量 可 以 是 : 

加 法 对 于 v(tA 门 B)=$， 有 v(AUB)=v(A) 十 v(B)，) 

对 称 其 中 |A|=|1B| 一 v(A)==v(B)，) 

AA ”如果 v(AUB)—v(Al\B)<v(A)+v(B); 


BE de v(AUB)—vVANBSv(A)+v(B); 

次 加 性 wRANB=H, AF v(AUB)Nv(A)+v(B); 

iin wRANB=H, A v(AUB)Sv(A)+v(B); 

HAE #2 HH f: (0, 1]—[0, 1], wR ANB=$ ĦA v(AUB=f(v(A), 
v(B)) 

Sugeno( 和 -模糊 度量 ) — de v 可 分 解 ， 对 于 ME[ 一 1，co]， 有 f=v(A)+v(B)+ 
Av(A) v(B) 

Sugeno 5 Choquet 积分 的 表现 取决 于 关联 模糊 度量 的 值 和 属性 。 用 于 定义 Choquet 
积分 的 模糊 度量 可 以 被 解释 为 权重 分 配 ， 不 是 仅 分 配给 单个 输入 而 是 分 配给 输入 子 集 。 输 
入 之 间 可 能 有 宛 余 或 者 菜 些 输入 之 间 相 辅 相 成 。 

(Choquet RF) ”给 定 一 个 模糊 度量 vv， 离散 的 Choquet 积分 由 下 式 给 出 : 


C,G) = Mix [vC x Z x0))— oC lan Z x9 })] (22. 8) 


其 中 (. ) 符 号 代表 组 成 部 分 x VAR AMAR (21) Sr (2) << x(n) ) HE CHE SIX OWA 
相反 ) 。 

Choquet 积分 的 特殊 分 类 包括 加 权 算 术 平 均 和 模糊 度量 分 别 为 加 法 或 对 称 的 OWA B 
Jk, UE (submodular) 4€ 44 E $ FA u t Choquet 积分 ， 结 果 是 增加 低 输 入 对 削 数 的 影响 
大 于 增加 高 输入 的 影响 。 相 反 地 ， 超 模 (supermodular) 模 糊 度量 导致 凸 的 函数 。 当 A(B 一 
v(A) 二 v(B) 时 ，Choquet 积分 是 震 等 的 、 齐 次 的 、 平 移 不 变 的 、 严 格 单调 的 。 如 果 模 糊 
度量 是 对 称 的 ， 则 函数 将 明显 地 满足 对 称 属性 。 

Choquet 积分 曾 在 数值 输入 中 占 主要 优势 ， 接 下 来 要 定义 的 Sugeno 积分 对 计数 输入 
很 有 用 ， 而 它 的 定义 也 用 到 了 模糊 度量 。 

GERAD Suzen 积分 ) 给 定 一 个 模糊 度量 w，Sugeno 积分 可 表示 为 

S.C) = max min{ zo ,v(H;)} (22.9) 


其 中 (. ) 表 示 一 个 非 递 减 的 输入 排列 ， fee vert Poe *<x(n))(4 Choquet 积分 相同 ) 
P H =G), …，(n)}。 
为 更 好 地 理解 Choquet 和 Sugeno 的 表现 已 经 引进 了 一 些 指标 。 特 别 是 Shapley A# 
出 了 一 个 给 定 输 入 整体 重要 性 的 指标 ， 同 时 两 个 输入 间 的 交互 指标 显示 了 它们 宛 余 和 相 辅 
相 成 的 程度 。 
GBD (Shapley i) 给 定 v 为 模糊 度量 。 对 于 每 个 iEN 的 Shapley 指标 为 
«0-2 X GHIA DADA U Gp - atA] 


AGN li) n! 
Shapley 44.4 m € guv) — (D), +, gn). 
GEHE ( 交 互 指标 ) 给 定 v 为 模糊 度量 。 对 于 每 对 i，jEN 交 互 指标 如 下 : 
hos Nn aA DUAL a U (44D —«A U UD — oA U GD +04] 


uy m 
ACN \ lij) (n 


Ae een ey rer re erste 
们 现在 的 权重 的 价值 超过 它们 各 自 的 权重 结合 起 来 的 值 。 
22.3.2.4 三 角 模 型 与 三 角 余 模 型 

合 取 和 析 取 聚合 函数 的 典型 例子 分 别 是 所 谓 的 三 角 模 型 与 三 角 余 模 型 (t-norms and t- 
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conorms)[28]。 给 定 任何 三 角 模 型 T. [0, 17—>[0, 1], 三 角 余 模 S 可 以 用 一 个 二 元 函 
数 表示 : 
Sls, y) —1—T(1—z, 1—y) 
反之 亦 然 。 因 此 ， 三 角 模 型 与 三 角 余 模型 经 常 被 并 行 研究 ， 因 为 许多 S 相关 的 属性 可 以 由 
T RBZ. PRICK e=1 时 三 角 模 型 是 关联 的 、 对 称 的 ， 而 中 立 元 素 e— 0 时 三 角 余 模型 
是 关联 的 、 对 称 的 。 下 面 是 四 个 基本 的 三 角 模 型 与 三 角 余 模型 的 定义 。 
(四 个 基础 的 三 角 模 型 ) 四 个 基本 的 三 角 模 型 的 二 元 用 例如 下 : 
最 小 化 Tmin(x, y)=min(z, y); 
结果 TP(x, yzcy; 
Lukasiewicz 三 角 模 型 ”TL(x, y)=max(rt+y—l, 0); 
0, (x, y) €[0, 1[* 
min(z, y), 其 他 ° 
EED 〈 四 个 基本 的 三 角 余 模 型 ) 四 个 基本 的 三 角 余 模型 的 二 元 用 例如 下 : 
最 大 化 Smax(z, y)=max(z, y); 
概率 和 SP(z，y) 王 Z 十 y 一 Zy; 
Lukasiewicz 三 角 模 型 SL(z, y)=min(rt+y, 1); 
Ls (z, 0€ lo, 1J’, 
WAR Solr, y)= max(r, y), 其 他 j ' 
有 参数 的 三 角 模 型 与 三 角 余 模 型 的 成 员 包 括 上 面 的 特殊 和 有 限制 的 用 例 。 这 些 成 员 是 
基于 生成 函数 来 定义 的 ， 称 为 阿 基 米 德 三 角 模 型 。 
GERD 〔 阿 基 米 德 三 角 模 型 ) 如 果 对 于 每 个 (a, b)E[0,，1] HA nll, 


n— times 


2，…} 使 得 T(ae，…，a)<p0， 那 么 三 角 模 型 及 为 阿 基 米 德 三 角 模 型 。 
对 于 三 角 余 模型 不 等 式 是 相反 的 ， 例 如 ， 三 角 余 模型 S>p。 连 续 的 阿 基 米 德 三 角 模 
型 可 以 使 用 它们 的 生成 器 来 表示 
TG, **, 2 =e Cg(Cz) 十 … 十 g(Cz)) 
其 中 g0)—0 则 g: [0，1] 一 [0，coj] 是 连续 的 、 严 格 递 减 的 函数 ， 是 g 的 反 和 矩阵 ， 如 
g P(x)—g !(min(g(1), max(g(0), x))) 
阿 基 米 德 成 员 包 括 Schweizer-Sklar, Hamacher, Frank, Yager, Dombi, Aczel-Alsi- 
na, Mayor-Torrens 和 Weber-Sugeno 三 角 模 型 和 三 角 余 模型 。 
22.3.2.5 零 模型 和 统一 模型 


在 某 些 情况 下 ， 也 许 需 要 高 输入 值 互 相 加 强 ， 而 低 输 入 值 拉 低 整体 输出 。 换 句 话说 ， 
聚合 函数 对 于 较 高 值 是 析 取 的 ， 对 于 较 低 值 是 合 取 的 ， 还 有 可 能 取 平 均值 ， 如 果 一 些 值 比 
较 高 、 一 些 值 比 较 低 。 这 是 较 高 值 被 解释 为 “ 正 ” 信 息 ， 低 值 被 解释 为 “ 负 ” 信 息 的 典型 
用 例 。 

在 其 他 情况 下 ， 有 可 能 要 聚合 高 低 值 使 得 输出 趋向 于 一 个 中 间 值 。 因 此 此 类 聚合 函数 
需要 在 它们 不 同 的 阶段 为 合 取 的 、 析 取 的 或 平均 的 。 而 统一 模型 和 零 模型 就 是 这 种 聚合 函 
数 的 典型 例子 ， 但 也 有 许多 其 他 的 模型 。 本 章 提供 以 下 定义 。 

RHH) 零 模 型 是 一 个 二 元 聚合 函数 V: [0，1]: 一 [0，1]， 是 关联 
的 、 对 称 的 ， 因 此 存在 一 个 元 素 a 属于 开 区 间 [0，1] 使 得 


激烈 积 Tp(x,; y= 
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Vi€[0, a], VG, 0t 
Vt€[a, 1], Vit, Dt 
(统一 模型 ) 统一 模型 是 二 元 聚合 函数 U: [0, 1-0, 1], € XX 
的 、 对 称 的 并 且 拥 有 一 个 中 立 元 素 e 属于 开 区 间 [0，1]。 
一 些 统一 模型 可 以 像 准 算术 平均 和 阿 基 米 德 三 角 模 型 类 似 的 方法 ， 使 用 生成 函数 来 构 
建 。 这 些 为 可 解释 的 统一 模型 。 
(可 解释 的 统一 模型 ) Bu: 10, 1]—[—o5, too] —^ 7 e iE 9 
的 双 射 验证 g(0) 王 一 co、8g(1) 王 十 co 以 致 对 于 某 些 eE[L0，1]， 有 g(Ce) 一 0。 
g (gig, (x, EO, 1]? \{(C, 1), (1, 0)} 
0, 其 他 
是 一 个 具有 中 立 元 素 e 的 合 取 统一 模型 ， 称 为 可 解释 的 合 取 统一 模型 。 
g (g(rz)+g(y)), Gs pelo, 1J: \{(0, D, G, 0) 
l, 其 他 
是 一 个 具有 中 立 元 素 e 的 析 取 统一 模型 ， 称 为 可 解释 的 析 取 统一 模型 。 


3 一 x 函数 是 一 个 可 解释 统一 模型 的 实例 [46]。 它 使 用 了 生成 函数 g(z) 一 In (了 =) 并 
用 在 了 专家 系统 PROSPECTOR[24] 中 来 组 合 不 确定 的 因素 。 


s U(z, »-| 


. Ux; »-| 





fœ) aS 


a+ [ities 
其 中 约定 0/070, i&&&[o, >] 上 是 合 取 的 ， 在 | 5. 1] 上 是 析 取 的 ， 其 他 情况 是 
平均 的 。 该 函数 是 关联 的 ， 具 有 中 立 元 素 e 一 1/2， 且 在 [0，1]" 边界 上 是 非 连续 的 。 


22.4 聚合 函数 的 构建 


有 很 多 聚合 函数 。 问 题 是 如 何 选择 一 个 最 适合 某 一 特定 应 用 聚合 函数 。 有 时 候 一 个 函 
数 就 可 以 满足 应 用 的 所 有 组 成 ， 在 其 他 时 候 一 个 不 同类 型 的 聚合 可 能 应 用 在 各 个 阶段 。 下 
面 的 探讨 可 能 会 有 所 帮助 。 


22.4.1 数据 收集 和 处 理 


数据 类 型 以 及 数据 收集 的 方式 影响 着 方案 的 聚合 。 如 果 用 户 能 够 体贴 地 为 连续 范围 内 
的 每 个 物品 提供 精确 的 分 数 或 者 他 们 自己 偏好 的 一 定 程度 的 确定 性 的 数值 描述 ， 那 么 RS 
将 会 非常 轻易 地 做 出 相关 的 推荐 。 当 然 ， 审 美 偏好 通常 局 限 在 从 用 户 那儿 得 到 明确 的 信 
息 ， 因 此 需要 加 强 交互 体验 。 我 们 将 简单 地 探讨 一 下 系统 能 够 获得 的 不 同类 型 的 数据 ， 以 
及 这 会 对 某 些 聚合 函数 的 适合 度 产 生 怎 样 的 影响 。 

有 序数 据 ”要 求 具体 评分 信息 的 CF 推荐 系统 通常 会 做 一 个 有 限 的 有 序 量 表 。 例 如 ， 
(1 一 不 喜欢 1，…，5 一 非常 喜欢 !) 。 另 一 方面 ， 将 用 户 行为 转换 为 用 户 配置 文件 的 有 序 部 
分 是 可 行 的 ， 例 如 ，{ 定 期 观看 ， 有 时 候 观 看 等 } 。 只 要 有 一 个 有 序 范围 ， 这 些 值 就 可 以 转 
换 成 数据 以 及 被 聚合 。 对 于 非 齐 次 的 和 那些 缺乏 平移 不 变性 特性 的 函数 ， 在 单元 区 间 内 显 
示 顺 序 值 是 有 必要 的 。 聚 合 值 的 不 精确 可 能 会 使 得 加 权 算 术 平 均 和 几何 平均 值 被 忽略 。 非 
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常 适合 有 序数 据 聚 合 的 聚合 函数 有 Sugeno 积分 和 诱导 OWA. 
。 Sugeno 积分 Su( 定 义 22. 9) 是 一 个 可 以 处 理 有 序数 据 并 考虑 交互 的 函数 。 模 糊 度 
量 值 应 该 与 输入 值 处 在 同一 个 有 序 范围 。Sugeno 积分 可 以 模拟 中 位 数 函 数 以 及 最 
小 化 和 最 大 化 函数 ， 有 将 输出 表示 为 有 序 值 的 优势 。 
。 诱导 OWA 函数 [45] 可 以 模拟 最 近邻 方法 即使 相似 度 表示 为 有 序 值 ， 虽 然 它 需 要 
评分 用 数值 表示 。 
数值 数据 ”如果 一 个 系统 可 以 将 用 户 输入 和 行为 表示 为 数值 数据 ， 考 虑 这 些 值 是 否 精 
确 是 有 用 的 ， 不 管 他 们 是 同样 的 还 是 独立 的 。 像 几何 平均 函数 当 输 入 值 比 算术 平均 的 输入 
值 高 时 变化 率 会 更 高 。 这 有 助 于 提供 输出 的 粒度 ， 不 过 这 也 意味 着 此 阶段 的 错误 会 影响 推 
荐 准确 度 。 在 CF 中 ， 两 个 用 户 可 能 具有 相同 的 偏好 ， 可 是 其 中 一 个 可 能 连续 地 高 估 物 品 。 
在 这 种 情况 下 ， 在 聚合 之 前 可 能 需要 标准 化 一 下 评分 ， 这 样 用 户 之 间 的 值 就 是 可 比 的 。 使 
用 WAM 表示 输入 之 间 的 独立 性 ， 然 而 其 他 平均 函数 特别 是 Choquet 积分 ， 可 以 表示 某 些 
输入 或 相关 分 数 之 间 的 交互 或 关系 。 
分 类 数据 ”有 时 候 使 用 分 类 数据 可 能 让 聚合 函数 变 得 不 可 用 。 如 果 分 类 之 间 没 有 顺 
序 ， 使 用 平均 或 最 大 化 和 其 他 对 建立 用 户 间 相似 度 有 帮助 的 技术 是 无 意义 的 。 转 换 分 类 数 
据 时 可 行 的 ， 比 如 ， 据 其 对 DF 中 某 个 原型 的 贡献 。 
然而 可 能 会 有 变化 : 一 些 与 d; 相关 的 向 量 的 组 成 部 分 可 能 会 丢失 ,例如 ，CF 中 的 评 
分 或 者 输入 d; 二 (xz;，…，Z,) 可 能 会 随 着 维度 不 同 而 变化 。 在 其 他 情况 下 ， 一些 输 入 和 输 
出 的 关联 的 不 确定 可 能 规定 一 个 值 的 范围 ， 例 如 ， 区 间 [6，8j] 作 为 一 部 电影 的 评分 。 关 联 
函数 或 生成 函数 可 以 根据 属性 来 聚合 具有 一 定 连续 性 的 不 同 维度 的 输入 ， 而 数据 转换 或 区 
间 值 函数 可 以 用 在 后 续 的 阶段 。 


22.4.2 ”期望 属 性 、 语 义 、 解 释 


一 旦 知道 了 数据 结构 ， 第 一 步 是 选择 聚合 函数 通常 要 决定 平均 、 合 取 、 析 取 或 混合 需 
要 哪 一 类 。 正 如 在 22.3.1. 1 节 中 讨论 的 一 样 ， 有 时 拥有 一 个 可 以 将 物品 分 类 为 偏好 次 序 
要 比 简单 地 提供 可 解释 的 输出 重要 得 多 。 本 章 讨 论 4 种 聚合 函数 ， 它 们 的 语义 可 以 用 来 决 
定 需要 哪 类 函数 。 

最 小 化 ( 合 取 的 ) 最 小 化 函数 使 用 最 小 化 输入 作为 输出 。 这 意味 着 如 果 所 有 的 输入 都 
高 ， 那 么 该 孙 数 只 能 返回 高 输出 。 这 种 聚合 对 于 使 用 式 (22. 5) 的 UB 系统 或 者 甚至 需要 所 
有 输入 都 满足 的 CB 系统 是 有 用 的 。 函 数 像 结 果 (TP) 对 任何 不 完美 输出 有 累积 效应 ， 所 以 
当 维度 较 高 时 ， 使 用 最 小 化 函数 会 更 有 用 。 

最 大 化 ( 析 取 的 ) 最 小 化 函数 像 聚 合 函 数 一 样 模拟 AND 操作 而 析 取 函数 模拟 OR 
操作 。 这 种 类 型 的 聚合 产生 的 结果 与 最 高 输入 相等 或 者 比 最 高 输入 还 要 高 。 这 在 KB、 
UB 和 CB 中 也 有 用 ， 如 果 有 多 重 偏好 或 标准 一 个 好 分 数 对 于 推荐 方案 足够 。 探 讨 
例 22.7. 

DEP) 一 个 CB 新 闻 推 荐 系统 的 用 户 与 其 配置 文件 相关 的 关键 词 有 {Haruki Mu- 
rakami, X-Men, bushfires, mathematics, Jupiter orbit) ， 任 何 一 个 新 闻 故 事 与 所 有 甚至 
几 个 关键 词 具 有 很 高 相关 性 是 不 太 可 能 的 ， 所 以 RS 使 用 析 取 聚合 作为 推荐 的 基础 。 4 

算术 平均 (平均 的 ) HE CF 中 聚合 用 户 评分 和 在 CB 中 聚合 物品 特性 时 ， 假 设 虽 然 
评分 很 不 相同 ,但 如 果 有 足够 多 的 输入 ， 输 出 将 会 是 可 靠 的 。 我 们 不 希望 推荐 被 一 个 孤 
立地 对 他 所 购买 的 不 满意 的 用 户 或 在 20 个 能 完全 满足 的 特性 中 的 一 个 特性 而 被 严重 
影响 。 
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统一 模型 (混合 的 ) 在 不 同行 为 需要 不 同 领域 阶段 的 情况 下 ， 这 就 需要 一 个 混合 聚合 
函数 。 这 可 以 直截了当 地 决定 ， 只 有 所 有 输入 的 值 包括 所 有 的 高 取 值 才 算是 高 ， 否 则 边界 
行为 会 影响 函数 的 精确 度 。 例 如 ， 统 一 模型 的 使 用 ， 它 允许 较 高 值 提高 分 数 也 允许 较 低 值 
拉 低 分 数 。 一 个 有 持续 性 高 分 的 物品 更 喜欢 一 个 具有 几乎 最 高 分 数 的 函数 而 不 是 一 个 或 两 
个 低 分 数 的 函数 。 

聚合 函数 的 某 些 属性 可 能 使 它们 具有 吸引 力 。 表 22. 1 列 出 了 我 们 展示 过 的 主要 聚合 
函数 以 及 它们 是 否 经 常 或 者 在 某 些 情况 下 满足 在 22. 4 节 中 详解 的 属性 。 


表 22. 1 聚合 函数 及 其 属性 


属性 WAMw Gw Hw Mwr] C S, OWAw max min Tp TL U V 
EG HE * + e * e * * $ * 
对 称 性 © © © © © © * * e * * * + 
不 对 称 性 © © © © © © l 
关联 性 多 e e e +e + 
严格 单调 © © © © © 
平移 不 变性 $ © * e * © * 
均匀 性 E * * * * e e * * 
HERRES * © * e * * * * * A 
中 立 性 © + 多 e * * 
吸附 性 元 素 — * * © * * e $ 


O=4F O=KRRE 人 三 依赖 使 用 的 下， S 


22.4.3 函数 表现 的 复杂 度 及 其 理解 


在 某 些 情况 下 ， 简 单 的 函数 像 WAM 就 可 以 满足 推荐 的 目标 了 ， 但 在 别 的 方向 有 潜在 
的 RS 改进 方法 。 根 据 其 特性 而 言 ，WAM 是 一 个 很 健壮 而 通用 的 函数 。 它 不 偏向 高 或 低 
的 分 数 ， 也 不 会 累积 误差 的 影响 ， 计 算 成 本 低 ， 由 于 被 广泛 采用 而 更 容易 理解 和 解释 。 我 
们 将 寡 平 均 和 Choquet 积分 作为 例子 ， 它 们 的 属性 让 它们 更 适合 这 种 情况 。 

宕 平均 “” 寡 平 均 是 参数 化 函数 ， 能 够 表示 从 最 小 化 到 最 大 化 的 渐进 过 程 的 函数 ， 包 括 
WAM。 在 拟 合 技术 可 供 我 们 使 用 时 该 函数 立即 生效 ， 因 为 我 们 可 以 使 用 一 个 过 程 来 确定 
任何 数量 的 函数 作为 最 佳 候选 。 下 面 讨论 调和 平均 数 M,、[ 一 1] 和 均 方 值 M,L2). MRA 
一 个 输入 为 0， 那么 调和 平均 数 的 输出 就 不 能 比 0 大 。 这 为 只 允许 考虑 至 少 部 分 满足 指标 
的 物品 提供 了 一 个 很 好 的 解释 ， 然 而 该 函数 不 是 合 取 的 ， 所 以 仍然 要 给 出 一 个 介 于 最 高 分 
和 最 低 分 的 一 个 分 数 。 调 和 平均 数 也 是 止 的 ， 且 其 输出 对 于 任意 d; 都 要 小 于 等 于 WAM 
的 输出 。 对 低 输入 的 补偿 可 以 减少 ， 所 以 为 了 评分 更 高 物品 必须 满足 更 多 的 指标 。 另 一 方 
面 ， 二 次 寡 平 均 更 趋向 于 高 分 数 ， 有 利于 那些 只 有 几 个 高 分 并 且 要 为 低 分 数 特 性 和 评分 补 
偿 更 多 的 物品 。 

Choquet 积分 M T 5358 Choquet 积分 可 以 表示 最 小 化 和 最 大 化 函数 之 间 的 函数 。 
Choquet 积分 的 使 用 最 有 趣 的 是 在 不 对 称 的 情况 下 ， 这 些 情况 往往 具有 某 些 相关 性 。 例 
如 ， 在 KB 推荐 系统 中 有 时 偏好 会 互相 矛盾 ， 而 在 其 他 时 候 又 可 能 互相 包含 。 在 例子 
Entree[16] 中 ， 可 以 看 到 用 户 可 能 对 一 个 价格 便宜 又 不 错 的 餐馆 评分 。 因 为 通常 会 涉及 一 
些 权衡 ， 所 以 满足 这 些 指标 的 餐厅 在 推荐 时 应 该 格外 奖励 。 在 CB 电影 推荐 系统 中 ， 一 个 
用 户 可 能 喜欢 Johnny Depp 和 Tim Burton。 如 果 有 许多 电影 是 Tim Burton 导演 并 由 
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Johnny Depp 主演 ， 那 么 重复 计算 这 些 特 性 可 能 就 没有 意义 了 。Choquet 积分 可 以 解释 这 
些 情况 的 组 合 ， 因 为 每 个 指标 子 集 都 附 有 一 个 权重 。“ 由 Depp 主演 Burton 导演 ”的 子 集 的 
权重 比 各 部 分 的 权重 总 和 小 ， 而 KB 中 便宜 又 不 错 的 餐馆 的 权重 比较 大 。 

当然 ， 有 时 数据 结构 可 能 很 难 理解 和 解释 一 个 特殊 函数 的 使 用 。 在 这 种 情况 下 ， 有 必 
要 检查 一 下 子 数 据 集 上 一 些 函 数 的 精确 性 。 进 行 最 小 化 、 最 大 化 、 算 术 平 均 和 调和 平均 数 
的 比较 可 能 会 显示 哪些 函数 是 有 用 的 。 


22. 4.4 权重 和 参数 的 确定 


CF 中 用 来 聚合 评分 的 权重 的 确定 通常 是 通过 用 户 之 间 的 相似 性 和 邻居 形式 来 推断 的 。 
CB 和 UB 中 的 权重 是 每 个 特性 对 用 户 的 重要 性 的 度量 指标 ， 而 加 权 HS 中 的 权重 表示 的 
是 推荐 组 成 部 分 的 可 信和 度 。 权 重 可 以 通过 预定 措施 ， 如 余弦 来 选择 ， 或 者 提前 由 RS 设计 
者 决定 。 例 如 ， 我 们 决定 使 用 权重 向 量 w— (0.4, 0.3, 0.2, 0. 1) 为 相似 用 户 加 权 。 一 些 
系统 通过 与 系统 质量 相关 的 隐 性 或 显 性 反馈 来 递增 地 调整 权重 ， 例 如 ，P-TangoL19] 中 的 
混合 RS。 在 22.5 节 中 我 们 将 讨论 确定 可 用 数据 集权 重 的 方程 。 


22.5 推荐 系统 中 的 复杂 聚合 过 程 : 为 特定 应 用 定制 


这 里 考虑 协同 过 滤 推 荐 系统 中 的 拟 合 问题 ， 然 而 在 基于 内 容 和 基于 用 户 推 荐 系统 中 
拟 合 权 重 也 是 可 行 的 ， 权 重 拟 合 的 系统 可 以 访问 输入 输出 值 ， 因 此 拟 合 的 强度 可 以 确定 
权重 或 参数 的 适合 度 。 拟 合 可 以 用 在 插值 或 近似 值 中 。 在 插值 情况 下 ， 目 标 是 精确 地 拟 
合 特定 的 输出 (在 聚合 函数 中 值 对 ((0，0，…，0)，0) 和 ((1，1，…，1)，1) 应 该 一 直 
是 插值 的 )。 在 RS 中 数据 经 常会 包含 一 些 错 误 或 近似 度 ， 因 此 插值 不 准确 的 数值 是 不 合 
适 的 。 在 这 种 情况 下 我 们 的 目标 是 尽量 接近 期 望 输出 而 不 是 完全 地 匹配 。 这 便 是 近似 
问题 。 

聚合 函数 的 选择 可 以 有 以 下 描述 表达 : 

给 定 一 组 数值 属性 Pi, P., ，… 和 数据 集 DSC yi. AE Pi, Pa, e EE 
续 且 满足 fxm, R=1, °°, K 的 聚合 函数 。 

我 们 也 可 以 通过 调整 一 个 拟 合 区 间 来 改变 问题 ， 例 如 ， 要 求 f(x) € D» wl. Xu 
值 如 何 指定 取决 于 具体 应 用 。 在 某 些 情况 下 ， 函 数 可 能 会 精确 地 拟 合 且 不 会 与 所 需 的 属性 
冲突 ， 然 而 大 多 数 情况 下 我 们 需要 最 小 化 近似 误差 。 

精确 地 说 ， 近 似 满足 度 的 等 式 fx ey, 可 以 解释 为 下 面 的 最 小 化 问题 : 

minimize || r || 
subject to f satisfies Di, Pz, °*, 

EP || rl 是 残 差 的 范 数 ， 例 如 ，rERx J PURUS XH n. fO y 之 间 的 差异 

向 量 。 有 许多 方法 来 选择 范 数 ， 最 流行 的 是 最 小 二 乘 范 数 


us d 
lri = (Say 
k=1 


(22. 10) 


和 最 小 绝对 偏差 标准 


Ir = [nl 
或 者 是 它们 的 加 权 类 似 ， 如 果 y 不 可 靠 。 
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— 22.89, 

在 CF 推荐 应 用 中 我 们 想 用 五 个 相似 用 户 为 给 定 用 户 预 测 新 物品 的 评分 。 现 
在 有 一 Ec c A 
d;)) H9, HR d;=(R(u5 di), Meg Rus; ai)) 表 示 每 个 邻居 Uis *'*, Us 在 过 去 物品 d; 
上 的 评分 ， RCu, di) 表 示 用 户 真实 的 评分 。 例如 ， 前 面 的 d;—x,, R(u, di) = yy. 表 
22. 2 给 出 了 一 个 拥有 两 个 由 邻居 评分 的 物品 的 示例 数据 集 ， 其 中 这 两 个 物品 用 户 还 没有 
评分 而 且 可 能 会 被 推荐 。 我 们 想 要 通过 一 个 为 每 个 用 户 分 配 权 重 w 的 最 小 二 乘法 来 定义 
一 个 加 权 算 术 平 均 方 法 。 所 以 有 如 下 公式 : 

minimize 270 ( > wR (u; d;) — RCu d) ) 


i=] j=l 
5 
subject to Sw; =1 


W 9° s Ws > 0 
这 是 一 个 二 次 规划 问题 ， 可 以 用 一 系列 的 标准 方法 求解 。 在 当前 的 例子 中 所 得 的 模型 权重 
分 配 为 w 王 <<0.27，0.07，0.06，0. 19，0.41 之 ， 未 评分 物品 的 推荐 分 数 为 4.7 和 7. 9。 
观察 与 预测 评分 的 最 大 差 值 为 2.5， 平 均值 为 0.98。 如 果 我 们 使 用 余弦 计算 来 确定 权重 ， 
则 权重 向 量 为 w=<0.19, 0.24, 0.23, 0.18, 0.17 JE E43 UN 5.6 和 7.1。 此 方法 的 
精确 度 与 前 者 类 似 ， 最 大 误差 2.48 和 平均 误差 1.6。 有 趣 的 是 ， 使 用 此 方法 时 用 户 us 是 
最 不 相似 的 用 户 ， 但 在 为 用 户 x 进行 精确 预测 时 却 是 最 重要 的 。 4 


表 22.2 CF 中 交互 评分 物品 数据 集 示 例 
用 户 及 邻居 对 1 = 1…10 的 物品 的 评分 





如 上 所 提 到 的 ， 如 果 可 供 推荐 的 物品 是 有 限 的 ， 则 排名 显得 格外 重要 (可 参照 [27])， 
而 不 是 预测 精确 度 。 在 有 意义 的 情况 下 ， 结 果 的 排名 可 以 用 FOR Ga, dO, vs ROn, 
d,)sf(GCGa, di), +, Ru, di)) if Ru, d) SR, dO MAKIN k RA. H 
中 /是 额外 的 约束 。 在 CF 中 ， 对 于 这 种 情况 ， 相 似 用 户 的 排名 能 更 好 地 反映 该 用 户 的 排 
名 ， 那 么 赋予 该 相似 用 户 的 权重 就 越 高 。 这 对 一 些 用 户 可 能 会 高 估 或 者 低估 物品 ， 但 对 他 
们 所 偏好 的 物品 保有 一 致 性 的 情况 有 帮助 。 

到 目前 为 止 ， 所 讨论 的 近似 问题 被 证 明 是 一 个 基本 的 非 线性 优化 问题 ， 或 者 一 个 特殊 
分 类 问题 。 一 些 优化 问题 使 用 凸 目 标 函 数 或 该 函数 的 变 体 ， 在 这 种 情况 下 难 的 不 是 该 步骤 
而 是 限制 条 件 的 定义 。 例 如 ， 拟 合 Choquet 积分 就 需要 定义 限制 条 件 的 指数 量 。 许 多 问题 
都 可 以 指定 为 线性 或 二 次 规划 问题 ， 这 些 问 题 已 被 广泛 研究 并 且 已 有 许多 可 用 的 解决 方 


OQ 本 节 所 有 实例 使 用 文献 [8] 中 的 软件 包 aotool 和 fmtools。 
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案 。 例 22. 9 Choquet 积分 作为 期 望 函 数 使 用 相同 的 数据 集 ( 表 22.2)。 在 实际 中 ， 鉴 于 
Choquet 积分 定义 在 2^ 个 点 上 (所 以 理想 情况 下 ， 拟 合 的 数据 量 应 该 远 高 于 此 )， 所 以 最 好 
拥有 一 个 更 大 的 数据 集 。 这 保证 了 结果 函数 不 会 太 特 化 。 

GRD 02850 系统 设计 者 认为 应 该 使 用 Choquet 积分 预测 未 知 评分 。 为 使 拟 
合 过 程 不 易 受 离 群 点 的 影响 ， 他 们 决定 使 用 最 小 绝对 偏差 标准 ， 并 将 优化 过 程 表示 为 


5 
minimize >)|C.(Cdi) 一 Redi)| 
i=l 


subject to v(A) — v(B) > 0,for all BCA 
v(A) >0,VACWN,v(¢) = 0,00N) = 1 

这 使 得 Choquet 积分 可 由 一 个 有 如 下 值 的 模糊 度量 定义 : 

v({1})=1, v({2})=0.33, v({3})=0, v({4})=v({5})=0.67, v((2, 3})=0. 33, 
v((2, 4)) —w((3, 4) —w((3, 5) —w(2, 3, 4)» —0.67, BS Rb P 8 v(A)=1. 
Shapley 值 很 好 地 表示 了 每 个 邻居 的 影响 力 ， 由 下 式 表示 : 

$,—0. 39, $,—0. 11, 4$,—0, $,=0.22, $,—0.28 
对 于 加 权 算术 平均 ， 这 些 值 显示 邻居 1，4，5 可 能 与 给 定 的 用 户 更 相似 。 我 们 还 发 现 值 对 
间 的 交互 指数 如 下 : 
I;—I;4-lg--—0.17, In =—0.33, Ty; =—0.5 
I;=0 (其 他 对 ) 

这 明了 一 些 邻 居 之 间 的 元 余 。 特 别 是 邻居 1 和 5 非常 相似 。 该 例 的 最 大 误差 为 1.6， 平均 
误差 为 0.6， 推 荐 分 数 为 6.0 和 8. 7。 由 于 代理 变量 ,该 函数 表现 出 与 最 大 化 函数 的 相似 。 
后 面 的 物品 得 分 高 ， 主 要 是 因为 邻居 4 和 5 给 出 的 高 评分 。 4 

22. 3. 2 节 定 义 的 聚合 函数 成 员 用 来 理解 和 解释 结果 是 很 方便 的 。 权 重 和 参数 有 一 个 
具体 的 意义 ， 而 拟 合 这 些 函 数 主要 涉及 找到 每 个 参数 的 最 佳 值 来 最 大 化 RS 的 可 靠 性 。 

然而 在 其 他 情况 下 ， 对 某 些 事情 的 解释 可 能 没有 那么 重要 : 我 们 只 是 希望 能 够 可 靠 并 
自动 预测 未 知 评分 。 有 许多 非 参数 化 方法 来 构建 聚合 函数 ， 虽 然 没 有 系统 解释 的 优势 ， 但 
可 以 自动 构建 并 能 很 好 地 拟 合 数据 。 一 个 “ 黑 盒 ”方法 可 以 用 来 构建 分 段 数据 上 的 基本 聚合 
操作 。 . 
我 们 可 通过 平滑 数据 以 及 确保 每 个 分 段 都 保持 其 特性 来 保证 单调 性 和 边界 条 件 的 指 
定 。 这 里 考虑 基于 样 条 聚合 函数 的 构建 [10]。 

单调 的 张 量 积 样 条 函数 定义 如 下 : 


A J 


fasi Uum) = DD” Sais „B; (21) Bj (xz )** Bj, (x,) 


j =1i,= 


IRAE UA REL RS UR T AE REPE IDEO FU CEN AE, TENA RA DUO BU A 
条 件 。 特 别 是 我 们 可 以 通过 表示 具有 系数 cj， j,…j, 的 线性 条 件 来 保持 单调 性 。 此 函数 的 
拟 合 涉 及 稀 玖 矩阵， 矩阵 的 大 小 会 随 着 基 范 数 的 变量 个 数 而 指数 级 增加 。 这 里 给 出 一 个 此 
拟 合 过 程 的 例子 ， 例 22. 10。 

EED EH) 22. 8 一 22. 9) 我 们 的 应 用 中 不 一 定 要 知道 相似 用 户 的 权重 。 我 们 仅 
想 要 自动 构建 可 以 预测 未 知 物品 的 评分 的 函数 。 我 们 决定 仍然 需要 单调 性 和 稼 等 性 来 保证 
输出 的 可 靠 性 ， 并 构建 一 个 表示 为 张 量 积 样 条 曲线 的 基本 聚合 函数 。 可 以 使 用 下 面 的 二 次 
规划 问题 : 
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5 
minimize X Cfas Cd;) —R(u,d;))’ 


subject to RE Rb et Sie ces >0 


fa(0,-,0) = 0, fa (1,5, =0 

竹 等 性 通过 使 用 多 样 插值 条 件 得 到 保证 ， 例 如 ，fs(t;，…，z) — ts AERA Eph 
方式 选择 (可 参照 [6，7])。 拟 合 的 非 参 数 化 函数 给 出 未 知 物品 的 推荐 结果 分 数 4.2 和 8. 1， 
所 以 看 起 来 后 者 应 该 推荐 给 用 户 。 4 
很 明显 ， 使 用 非 参 数 化 还 是 参数 化 方法 以 及 使 用 多 么 复杂 的 聚合 函数 是 系统 设计 者 的 选 
择 。 推 荐 系统 通常 需要 实时 决定 并 处 理 大 数据 集 ， 所 以 需要 寻找 表达 性 和 简单 性 之 间 的 平衡 。 


22.6 总 结 


本 章 的 目的 是 展示 前 端的 聚合 函数 并 介绍 对 推荐 有 益 的 函数 的 构建 。 这 包括 由 许多 权 
重 定义 的 方法 ，Choquet 积分 是 由 模糊 度量 的 ， 通 过 生成 器 构建 的 三 角 模 型 /三 角 余 模型 
及 可 解释 的 统一 模型 。 目 前 推荐 系统 使 用 的 许多 方法 都 涉及 了 构建 加 权 算 术 平均 值 ， 其 中 
权重 通过 不 同 的 相似 性 计算 方法 决定 ， 然 而 ， 在 许多 情况 下 ， 仅 仅 提高 一 点 复杂 度 函 数 的 
精确 度 和 可 扩展 性 就 可 以 得 到 改善 。 我 们 提供 了 详细 的 例子 展现 聚合 函数 用 在 推荐 系统 过 
程 中 的 不 同方 法 ， 包 括 评分 聚合 、 特 性 组 合 、 相 似 性 和 邻居 的 形成 以 及 加 权 混 合 系统 中 的 
组 件 组 合 。 我 们 还 在 尝试 找到 能 最 好 地 模拟 数据 集 的 权重 、 相 似 性 或 者 参数 时 引进 了 一 些 
软件 工具 使 得 函数 符合 数据 (可 参考 [29，25]) 。 

聚合 函数 的 广泛 研究 并 有 大 量 的 重要 结果 ， 其 中 有 些 已 经 应 用 到 了 推荐 系统 中 。 由 于 
这 里 提供 的 只 是 一 个 介绍 ， 我 们 推荐 您 阅读 22. 7 节 里 所 列 的 最 近 的 书籍 ， 它 们 提供 了 许 
多 聚合 方法 的 详细 内 容 。 
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推荐 系统 中 的 主动 学 习 





Neil Rubens、 Dain Kaplan 和 Masashi Sugiyama 


23. 1 简介 


通常 假设 推荐 系统 向 用 户 展示 物品 的 原因 只 是 要 向 用 户 推荐 他 可 能 感 兴趣 的 物品 。 推 
荐 系统 当然 要 推荐 物品 ， 但 这 种 假设 虽然 与 字面 上 的 称谓 无 关 ， 却 曲解 了 系统 在 做 的 “ 推 
荐 ”。 为 用 户 展示 一 个 物品 还 有 另 一 个 原因 : 更 多 地 了 解 他 /她 的 喜好 ， 或 者 他 /她 的 好 恶 。 
这 就 是 主动 学 习 (Active Learning，AL)。 为 推荐 系统 增加 主动 学 习 功能 够 帮助 用 户 更 好 
地 意识 到 自己 的 好 恶 ， 同 时 可 以 为 系统 提供 新 信息 以 便 分 析 后 续 的 推荐 。 其 实 ， 在 推荐 系 
统 中 引入 主动 学 习 能 够 个 性 化 推荐 过 程 ， 该 过 程 是 有 意义 的 ， 因 为 推荐 本 质 上 就 是 个 性 
化 。 该 过 程 使 得 系统 主动 改变 展示 给 用 户 哪 些 物品 (例如 ， 用 户 在 注册 或 正常 使 用 情况 下 
的 物品 展示 )， 并 让 用 户 能 够 自由 地 发 掘 他 们 的 兴趣 。 

可 惜 系统 鲜 有 机 会 能 够 在 用 户 评论 /阅读 物品 时 或 通过 用 户 的 浏览 历史 获取 相关 信 
B? .由 于 这 种 机 会 不 多 ， 所 以 我 们 希望 尽 可 能 确保 这 些 数 据 能 够 告诉 我 们 关于 用 户 偏好 的 
重要 信息 。 毕 竟 ， 用 户 数据 是 一 个 公司 的 最 有 价值 的 资产 之 一 。 

例如 ， 当 一 个 新 用 户 开 始 使 用 推荐 系统 时 ， 系 统 对 其 偏好 所 知 甚 少 L44，36，2]j。 获 
取 用 户 偏好 的 一 个 普通 方法 是 要 求 用 户 对 一 组 物品 评分 (被 称 为 训练 集合 ) 。 于 是 估计 用 户 
偏好 的 模型 应 运 而 生 。 由 于 用 户 浏览 的 物品 数量 不 能 覆盖 全 部 类 别 ( 有 可 能 使 得 主动 学 习 
任务 与 推荐 做 无 用 功 )， 那 么 供用 户 浏 览 的 物品 集合 一 定 是 非常 有 限 的 。 因 此 学 习 模 型 的 
准确 性 很 大 程度 上 依赖 于 良好 的 训练 集合 的 选择 。 系 统 可 能 会 要 求 用 户 为 星球 大 战 工 ， 
卫 ， 卫 进行 评分 。 通 过 用 户 对 三 部 曲 的 评分 ， 我们 将 很 好 地 了 解 用 户 对 星球 大 战 的 偏好 ， 
推 而 广 之 ， 了 解 用 户 对 其 他 科幻 电影 的 爱好 ， 当 然 总 体 上 收集 到 的 信息 是 有 限 的 。 所 以 选 
择 该 三 部 曲 并 不 能 提供 丰富 的 信息 。 选 择 类 似 星球 大 战 的 流行 物品 的 另外 一 个 问题 ， 就 
是 根据 定义 大 部 分 人 会 喜欢 它们 (和 否则 就 不 流行 了 ) 。 那 么 选择 流行 物品 只 能 获得 很 少 的 用 
户 信息 (除非 用 户 的 品味 特殊 ) ， 就 不 足 为 奇 了 。 

有 这 样 一 个 观点 认为 主动 学 习 是 一 个 令 人 讨厌 具有 侵 人 性 的 过 程 ， 但 它 并 不 必 如 此 
[54，38]。 如 果 展 示 的 物品 用 户 感 兴趣 ， 那 么 这 有 可 能 是 一 个 发 现 与 探索 的 过 程 。 有 的 
推荐 系统 提供 一 个 “给 我 惊喜 !" 的 按钮 来 激励 用 户 进 入 探索 过 程 ， 而 且 确 实 有 许多 毫 无 
购买 意图 的 用 户 浏 览 看 看 有 什么 建议 。 探 索 是 使 用 户 更 好 地 意识 到 自己 偏好 (是 否 改 
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第 23 章 ”推荐 系统 中 的 主动 学 习 489 





变 )， 同 时 将 偏好 告知 系统 的 关键 。 请 记 住 ， 在 某 种 意义 上 用 户 不 仅 可 以 通过 他 们 对 物 
品 的 评分 ， 也 可 以 通过 他 们 所 消费 的 物品 进行 定义 ， 所 以 促使 用 户 为 不 同 的 物品 评分 有 
可 能 进一步 区 分 彼此 的 喜好 ， 并 使 得 系统 能 够 提供 更 好 的 个 性 化 服务 和 更 好 地 满足 他 们 
的 需求 。 

本 章 只 是 对 推进 系统 中 主动 学 习 的 一 个 浅 析 ?。 然 而 我 们 希望 本 章 能 够 提供 必要 的 
基础 。 

如 想 进 一 步 阅 读 ， 文 献 [46] 对 机 器 学 习 ( 侧 重 于 自然 语言 处 理 和 生物 信息 学 ) 情 景 下 的 
主动 学 习 做 出 了 一 个 不 错 的 整体 介绍 。 对 关于 主动 学 习 的 理论 研究 (主要 专注 于 实验 设计 
领域 ) 可 以 参照 文献 [7，4，22]; 还 有 计算 机 科学 领域 中 最 近 的 研究 成 果 [16，5，51] 。 


23.1.1 推荐 系统 中 主动 学 习 的 目标 


不 同 的 推荐 系统 有 不 同 的 学 习 目标 ( 见 第 8 章 )， 使 得 它们 的 主动 学 习 部 分 也 需要 不 同 
的 目标 。 因 此 ， 一 个 主动 学 习 方法 可 能 比 另 外 一 个 方法 更 能 满足 某 个 给 定 的 任务 [35]。 例 
如 ， 正 在 构建 的 推荐 系统 中 什么 是 重要 的 ( 见 第 10 章 )? 注册 的 难度 (用 户 负担 )? 用 户 对 
服务 是 否 满意 (用 户 满意 度 )? 系统 预测 用 户 偏好 的 功能 如 何 (准确 度 )? 系统 是 否 能 很 好 地 
表达 用 户 的 偏好 (用 户 效用 )? 系统 如 何 将 从 一 个 用 户 学 习 到 的 信息 应 用 在 其 他 用 户 上 ( 系 
统 效 用 )? 系统 的 功能 性 也 可 能 比较 重要 ， 例 如 ， 当 一 个 用 户 在 查询 感 兴趣 的 物品 的 评分 
时 ， 系 统 没 有 足够 的 数据 来 预测 ， 这 时 系统 会 如 何 响应 ? 在 这 种 情况 下 ， 是 否 会 给 用 户 一 
个 模糊 的 答案 ， 从 而 允许 用 户 在 有 兴趣 和 时 间 时 对 系统 进行 进一步 的 训练 ? 还 是 要 求 他 们 
在 系统 提供 预测 之 前 对 其 他 物品 进行 评分 ? 或 许 用 户 之 前 体验 过 该 物品 (例如 ， 看 过 这 部 
电影 或 者 预告 片 ) 并 认为 他 们 的 评分 与 预测 评分 相差 很 大 [10]j。 在 所 有 情况 下 系统 如 何 响 
应 用 户 值得 仔细 思考 。 

一 般 主动 学 习 不 考虑 探索 (学 习 用 户 偏 好 ) 与 开发 (利用 用 户 偏好 ) 的 权衡 ， 也 就 是 说 它 
并 不 根据 系统 目标 动态 分 配 探 索 / 开 发 的 权重 。 而 这 种 权衡 是 很 重要 的 ， 因 为 对 于 一 无 所 
知 或 所 知 其 少 的 新 用 户 来 说 ， 通 过 为 用 户 提供 可 能 感 兴趣 的 预测 (开发 ) 来 验证 系统 的 价值 
是 有 益 的 ， 同 时 长 期 用 户 希 望 能 够 通过 探索 来 扩展 自己 的 兴趣 [38，41] 。 

虽然 一 个 推荐 系统 的 目标 可 能 是 为 用 户 提供 准确 的 预测 ， 但 系统 也 可 能 需要 推荐 高 
新 颖 性 /惊喜 度 的 物品 ， 提 高 覆盖 率 ， 使 利润 最 大 化 或 者 决定 用 户 是 否 能 够 评 佑 给 定 的 
物品 ， 举 几 个 例子 [44，21，33]。 多 重 目标 可 能 需要 同时 加 入 考虑 ( 见 第 24 章 )， 例 如 ， 
最 小 化 训练 数据 净 购 置 成 本 的 同时 最 大 化 净利 润 ， 或 者 找到 为 用 户 提供 物品 ， 期 望 输出 
与 效用 和 无 用 的 替代 效用 之 间 的 最 佳 搭配 [38]。 训 练 的 效用 也 可 能 是 很 重要 的 ， 例 如 ， 
为 用 户 提 供 他 们 负担 不 起 的 进口 车 的 预测 评分 可 能 是 毫 无 用 处 的 ， 所 以 应 该 避免 这 种 情 
况 。 可 以 看 出 系统 目标 常常 要 比 单纯 的 预测 准确 度 复 杂 得 多 ， 并 且 可 能 包含 多 个 目标 的 
结合 。 

而 推荐 系统 往往 有 一 个 不 明确 或 开放 式 的 目标 ， 即 预测 用 户 可 能 感 兴趣 的 物品 ， 正 如 
其 名 ， 基 于 对 话 的 主动 学 习 [32，37，9] 将 与 用 户 对 话 作为 面向 目标 方法 。 它 通过 问题 的 
迭代 引出 用 户 响 应 来 减少 在 快速 发 现 用 户 寻 找 内 容 时 的 搜索 空间 ( 见 23. 8 节 )。 . 

新 用 户 问题 ” 当 用 户 刚 开 始 使 用 一 个 推荐 系统 时 ， 他 们 和 希望 通过 少量 训练 就 可 以 看 到 
有 趣 的 结果 。 尽 管 系统 对 用 户 偏好 所 知 甚 少 ， 但 选择 能 够 最 大 化 理解 新 用 户 需求 的 训练 集 
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合 进行 评分 是 很 重要 的 [35]。 

新 物品 问题 随 着 新 物品 的 引进 ， 通 过 选择 用 户 对 其 评分 来 快速 提高 这 些 物 品 的 预测 
准确 性 是 很 重要 的 [24]。 

获取 输出 值 的 成 本 ”获取 输出 值 的 不 同方 法 有 着 不 同 的 成 本 。 例 如 ， 将 用 户 点 击 一 个 
推荐 物品 作为 正 输出 、 不 点 击 作 为 负 输 出 的 内 因 策略 的 用 户 负 担 很 小 。. 相反 ， 要 求 用 户 明 
确 地 为 物品 评分 成 本 比较 高 ， 即 使 这 取决 于 任务 。 看 类 似 星 球 大 战 的 电影 后 来 评分 也 许 会 
提供 不 错 的 结果 ， 但 是 需要 大 量 的 用 户 负 担 [20]， 而 对 笑话 进行 评分 就 不 需要 。 这 通常 与 
探索 /开发 耦合 不 谋 而 合 ， 且 从 不 同和 输入 获取 输出 的 权衡 也 应 该 考虑 在 内 (如 确定 性 /不 确 
定性 、 易 于 评估 性 等 ) 。 

适应 不 同 的 主动 学 习 方法 虽然 我 们 一 直 专 注 于 减少 预测 错误 的 传统 目标 ， 同 样 构建 
一 个 方法 来 最 大 化 其 他 目标 如 利润 也 是 合理 的 。 在 这 种 情况 下 模型 将 选用 增加 利润 而 不 是 
评分 准确 度 的 集合 。 


23.1.2 例证 


让 我 们 看 看 推荐 系统 中 主动 学 习 的 一 个 具体 例子 。 这 里 只 阐述 了 一 些 概念 ， 所 以 有 些 
过 于 简单 。 请 记 住 相似 度 度量 方式 会 随 着 使 用 的 方法 不 同 而 不 同 。 这 里 假设 如 果 电 影 属 于 
相同 的 类 型 那么 他 们 彼此 相似 。 图 23. 1 显示 两 个 图 表 ， 最 左边 的 是 起 始 状态 ， 其 中 右上 
方 用 户 组 已 对 一 部 电影 评分 ， 该 电影 属于 科幻 类 。 右 边 的 图 表 显 示 了 4 个 下 一 步 可 供 选 择 
的 训练 集合 (a)、(b)、(c) 或 (d)。 如 果 我 们 选择 了 训练 集合 (a) 一 个 模糊 类 型 电影 (如 金鱼 
猎人 ) 并 不 会 影响 预测 结果 ， 因 为 邻 域 内 没有 其 他 电影 (集合 ) 。 如 果 我 们 选择 训练 集合 
(b)， 我 们 就 可 以 为 相同 区 域 的 集合 进行 预测 ， 但 是 这 些 预测 可 能 已 经 从 相同 区 域内 的 训 
练 集合 获得 (根据 左边 的 图 表 ) 。 如 果 选 择 了 训练 集合 (c) ， 我 们 可 以 进行 新 的 预测 ， 但 只 
可 以 对 该 区 域内 的 其 他 三 个 集合 ， 恰 好 是 僵尸 电影 。 选 择 训练 集 (d) 可 以 对 该 区 域 的 大 量 
测试 集合 进行 预测 ， 预 测 结果 为 喜剧 电影 。 因 此 (d) 是 最 理想 的 选择 ， 因 为 这 人 允许 我 们 对 
预测 结果 做 出 最 大 的 改进 ( 因 其 具有 最 多 的 训练 集 )9 。 
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Al 23.1 主动 学 习 : 例证 ( 见 23.1.2 45) 


23.1.3 主动 学 习 的 类 型 
本 章 的 主动 学 习 方法 分 类 基于 我 们 对 它们 的 主要 动机 /目标 的 解释 。 需 要 注意 的 是 ， 


O 这 可 能 取决 于 推荐 系统 中 采用 的 特定 预测 方法 。 
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给 定 的 主动 学 习 方法 可 能 有 很 多 种 分 类 方法 ， 例 如 ， 接 近 于 某 个 决策 边界 的 取样 可 能 会 被 
归 类 为 基于 不 确定 输出 的 方法 ， 因 其 输出 未 知 ; 基于 参数 的 方法 ， 因 其 会 改变 模型 ;或 者 
基于 决策 边界 的 方法 ， 因 其 边界 线 会 因此 偏 移 。 然 而 ， 由 于 该 取样 的 执行 与 决策 边界 有 
关 ， 我 们 将 考虑 该 方法 的 首要 动机 ， 并 根据 该 方法 分 类 。 

除了 通过 主要 动机 进行 分 类 ( 见 23.1 节 )， 为 了 便于 理解 ， 进 一 步 将 一 个 方法 的 算法 
细 分 为 两 个 常见 的 分 类 类 型 : 基于 实例 的 和 基于 模型 的 。 

基于 实例 的 方法 ”该 类 型 的 方法 根据 它们 的 属性 选择 集合 ， 试 图 在 没有 显 性 知识 的 基 
础 模型 中 通过 找到 系统 中 与 其 他 用 户 最 匹配 的 用 户 来 预测 评分 。 对 于 此 类 型 的 通用 名 称 包 
括 基 于 内 存 的 、 惰 性 学 习 、 基 于 实例 的 和 非 参数 化 方法 [2]。 假 设 现 有 的 任何 数据 以 及 根 . 
据 基础 模型 得 到 的 评分 都 是 可 读 取 的 。 

基于 模型 的 方法 ”该 类 型 的 方法 选择 集合 来 尝试 构建 一 个 最 好 的 模型 ， 该 模型 可 以 解 
释 用 户 提供 的 用 来 预测 用 户 评分 的 数据 L2]j。 这 些 集合 也 用 来 最 大 化 地 减少 模型 的 预测 错 
误 。 这 里 假设 除了 基于 实例 的 方法 可 访问 的 所 有 数据 ， 还 可 以 访问 模型 及 其 参数 。 

自主 学 习 模式 : 批 处 理 和 顺序 处理 因为 用 户 通 常 希望 系统 可 以 立即 输出 一 些 有 趣 的 
东西 ， 所 以 一 个 常用 的 方法 是 在 用 户 为 一 个 物品 评分 后 以 顺序 的 方式 计算 该 用 户 的 预测 评 
分 。 同 时 也 可 以 在 调整 模型 之 前 允许 用 户 对 多 个 物品 或 一 个 物品 的 多 个 特性 进行 评分 。 另 
一 方面 ， 顺 序 的 选择 训练 集 有 个 好 处 ， 即 允许 系统 响应 用 户 提供 的 数据 并 立即 做 出 必要 的 
调整 。 尽 管 该 方法 需要 付出 每 一 步 都 需要 与 用 户 交 互 的 代价 。 由 此 批 处 理 主动 学 习 与 顺序 
主动 学 习 二 者 之 间 产 生 了 一 个 权衡 : 数据 利用 率 与 用 户 交 互 的 次 数 。 


23.2 数据 集 的 属性 


在 考虑 任何 主动 学 习 方法 时 ， 为 了 最 大 化 给 定 集合 的 效用 ， 以 下 三 个 因素 应 该 考虑 在 
内 。 前 两 个 因素 的 补充 说 明 如 下 。 以 例证 为 例 ( 图 23.1). 

(R1) 被 表示 的 : 已 经 被 现 有 的 训练 集 表 示 了 吗 ? 如 集合 (5)。 

(R2) 可 表示 的 : 该 集合 是 一 个 表示 其 他 数据 集 的 合适 候选 吗 ? 或 者 是 一 个 离 群 点 吗 ? 
如 集合 (a)。 

RIAR: 选择 该 集合 会 产生 更 好 的 预测 评分 或 者 完成 另 一 个 目标 吗 ? MRAOE 
至 集合 (c) 。 

(R1) 由 训练 数据 表示 “正如 本 章 的 简介 中 所 解释 的 ， 要 求 对 一 个 三 部 曲 如 《星球 大 战 》 
的 若干 卷 进行 评分 并 不 一 定 有 好 处 ， 因 为 对 于 获取 用 户 偏好 新 信息 可 能 贡献 不 大 。 因 此 为 
了 避免 获得 宛 余 信息 ， 主 动 学 习 方 法 应 该 支持 训练 集中 未 被 完全 表示 的 数据 [18]。 

(R2) 测 试 数据 的 代表 ”有 一 点 很 重要 ， 就 是 任何 通过 主动 学 习 算 法 选择 进行 评分 的 物 
品 要 尽 可 能 地 代表 测试 物品 集 ( 这 里 认为 所 有 物品 都 可 能 属于 测试 集 )， 因 为 算法 的 准确 度 
将 基于 这 些 物 品 进行 评估 。 如 果 被 选 电影 来 自 一 个 小 的 类 别 ， 像 例证 (图 23. 1) 中 的 僵尸 电 
影 ， 那 么 获取 该 电影 的 评分 对 其 他 主流 类 别 的 用 户 偏好 贡献 不 大 。 另 外 用 户 通常 倾向 于 对 
自己 感 兴趣 的 电影 类 型 评分 ， 这 就 意味 着 任何 在 训练 集中 占 优 势 的 类 别 可 能 只 代表 了 所 有 
物品 的 一 小 部 分 [38]。 为 了 增加 信息 获取 量 ， 选 择 能 够 提供 关于 其 他 未 被 评分 物品 的 信息 
的 具有 代表 性 的 物品 是 至 关 重 要 的 [18，47，53] 。 


23.2.1 其 他 考虑 因素 
除了 23. 2 节 列 出 的 三 个 条 件 ， 数 据 集 的 其 他 标准 也 应 该 被 考虑 ， 如 下 面 的 标准 。 
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代价 ”正如 本 章 简介 所 说 ， 从 用 户 选 择 中 获取 隐 式 反馈 要 比 要 求 用 户 显示 地 对 物品 评 
分 代价 小 [19]。 这 可 看 作 一 个 可 变 成 本 问题 。 处 理 该 问题 的 一 个 方法 是 考虑 为 物品 打 标 签 
的 成 本 以 及 将 来 评估 加 入 训练 集 物品 被 错误 分 类 的 代价 [27]。 然 而 成 本 有 可 能 是 事先 未 知 
的 [48]。 

可 估价 性 ”用户 有 可 能 不 会 提供 物品 评分 ， 你 不 可 能 为 一 部 没 看 过 的 电影 正确 评分 ! 
因此 建议 也 要 考虑 用 户 能 够 评估 一 个 物品 的 概率 [20] 。 

显著 性 ”以 决策 为 中 心 的 主动 学 习 强 调 评分 更 能 够 影响 决策 的 物品 ， 并 且 需 要 与 决策 
相关 的 实例 ， 这 样 一 个 相对 较 小 的 评估 变化 能 够 改变 预测 评分 项 部 的 物品 顺序 [43]。 例 
如 ， 无 用 的 标记 物品 会 导致 用 户 首页 推荐 的 前 十 部 电影 (突出 物品 ) 的 排名 移动 或 重新 排 
列 ， 它 可 能 被 认为 没 多 大 用 处 。 这 也 可 能 出 现在 只 考虑 获取 系统 强烈 推荐 的 物品 评分 的 情 
况 下 [6j。 

流行 性 ”建议 将 物品 的 流行 性 也 考虑 在 内 [35]， 例如， 有 多 少 人 对 该 物品 进行 了 评 
分 。 该 操作 基于 这 样 一 个 理念 ， 因 为 流行 物品 有 许多 人 评分 ， 所 以 它 有 可 能 信息 相当 丰 
富 。 相 反 地 ， 也 应 该 考虑 一 个 物品 的 评分 不 确定 性 ， 因 大 多 数 用 户 趋向 于 为 积极 物品 打 高 
分 ， 这 表明 该 物品 并 不 能 提供 太 多 的 辨别 力 ， 因 而 不 值得 包括 在 训练 集中 。 

最 佳 /最 差 文献 [29] 中 已 指出 查看 最 佳 /最 差 评论 ， 在 用 户 对 一 个 物品 做 出 决定 
时 是 有 用 处 的 。 将 此 观点 扩展 到 主动 学 习 中 ， 我们 假设 这 样 一 个 “最 佳 /最 差 ” 原 则 ， 
获取 用 户 的 最 佳 /最 差 评分 ( 因 其 可 能 很 好 地 捕获 用 户 的 偏好 ) 对 于 用 户 偏 好 做 出 决定 
是 有 益 的 。 通 过 要 求 用 户 提 供 他 /她 最 喜欢 /不 喜欢 的 物品 将 主动 学 习 问 题 转化 为 要 求 
用 户 对 已 知 分 类 中 的 物品 进行 评分 的 问题 (例如 ， 在 喜欢 的 类 别 中 选择 一 部 喜欢 的 电 
影 )， 以 及 获取 物品 过 程 招致 的 成 本 问题 L30]。 这 个 过 程 被 称 为 “主动 类 选择 ”。 该 过 
程 与 传统 主动 学 习 技术 相反 ， 传 统 技术 中 标记 物品 的 过 程 (而 不 是 物品 本 身 ) 被 认为 是 
产生 成 本 的 原因 。 


23.3 主动 学 习 在 推荐 系统 中 的 应 用 


在 传统 的 主动 学 习 中 用 户 被 要 求 对 预选 的 物品 评分 。 这 往往 是 在 刚 加 入 的 时 候 ， 
虽然 预选 的 列表 在 以 后 也 会 展示 给 已 存在 的 用 户 。 有 人 可 能 认为 既然 这 些 物 品 是 由 专 
家 挑选 的 ， 那么 它们 应 该 已 经 捕获 了 用 来 决定 用 户 偏好 的 重要 属性 。 从 概念 上 可 能 听 
起 来 比较 合理 ,但 是 实际 中 这 会 导致 选择 的 物品 只 能 最 好 地 预测 用 户 平均 的 偏好 。 由 
于 推荐 系统 的 思想 是 提供 个 性 化 推荐 ， 所 以 通过 个 性 化 方法 选择 评分 物品 应 该 更 有 
意义 。 


23.3.1 方法 总 结 和 矩阵 


下 面 的 矩阵 ( 表 23. 1) 总 结 了 本 章 概述 的 方法 。 未 提供 明确 的 性 能 数字 ， 据 我 们 所 知 还 
不 存在 这 样 的 综合 比较 。 主 动 学 习 方法 比较 时 可 能 带 有 个 人 偏见 ， 任 何 结果 都 将 是 不 确定 
的 。 这 是 因为 作者 有 固定 预测 方法 ， 然 后 将 其 应 用 在 一 个 或 多 个 主动 学 习 方 法 中 比较 性 能 
的 倾向 。 然 而 ， 主 动 学 习 方法 经 常 是 为 某 个 特定 的 预测 方法 设计 ， 因 此 若 应 用 在 不 同 的 预 
测 方法 中 性 能 可 能 并 不 好 (这 会 产生 潜在 的 误导 性 结果 ) ， 或 者 如 果 基 础 系统 不 能 提供 所 需 
信息 ， 这 些 方法 甚至 不 可 用 ， 如 评分 评估 分 布 。 以 上 原因 使 我 们 不 得 不 忽略 任何 形式 的 性 
能 数字 。 
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表 23.1 方法 总 结 矩 阵 






方法 主要 动机 





可 能 的 限制 条 件 


















减少 以 下 内 容 的 不 确定 性 : 
。 评分 评估 ( 见 23.5.1 节 ) 
。 决策 边界 ( 见 23. 5. 2 节 ) 
。 模型 参数 ( 见 23. 5. 3 节 ) 


降低 不 确定 性 可 能 并 不 能 总 是 提 
高 准确 率 ; 该 模型 可 能 只 对 错误 的 
事情 肯定 (如 用 错 了 预测 方法 ) 


降低 不 确定 性 ( 见 23. 5 节 ) 





pure 与 以 下 内 容 的 关系 来 减少 预测 错误 : 
输出 评估 中 的 变化 ( 见 23. 6. 1. 1 节 ) 

。 测试 集 错误 ( 见 23. 6. 1. 2 节 ) 

。 参数 评估 中 的 变化 ( 见 23. 6.2.1 节 ) 

。 参数 估计 值 的 方差 ( 见 23. 6. 2. 2 节 ) 


可 靠 地 评估 错误 的 减少 是 困难 并 


b eii 见 E 
减少 错误 ( 见 23.6 45) 且 计 算 昂贵 的 









基于 以 下 内 容 之 间 的 共识 找 出 有 用 的 训练 集 : 
。 聚 类 中 的 模型 ( 见 23.7.1 节 ) 
。 多 重 候 选 模 型 ( 见 23. 7. 1 节 ) 


由 于 其 效用 取决 于 模型 /候选 的 
质量 且 可 以 是 计算 昂贵 的 ， 因 为 它 
的 执行 与 多 重 模型 /候选 有 关 






基于 聚 类 ( 见 23. 7 45) 


23.4 主动 学 习 公 式 
被 动 学 习 ( 见 图 23. 2) 是 指 训练 数据 预先 提供 或 系统 无 须 努力 获取 新 数据 ( 仅 通过 用 户 


行为 随 着 时 间 不 断 积累 ) 。 


训练 数据 HERE 
请 求 积极 学 习 


BAN 一 全 二 二 一 一 


Ex was or TIT 


图 23.2 主动 学 习 应 用 一 个 交互 /迭代 的 过 程 来 获得 训练 数据 ， 不 像 被 动 学 习 ， 数 据 是 给 定 的 


Ae 一 方面 主动 学 习 主动 地 选择 训练 集 ( 输 入 ) 以 便 观 察 信息 最 丰富 的 输出 (用 户 评 分 行 
为 等 ) 。 

让 我 们 用 一 个 更 正式 的 方式 来 定义 主动 学 习 问 题 。 一 个 物品 被 看 作 一 个 多 维 输入 变量 
并 用 一 个 向 量 x 描述 (也 称 为 一 个 数据 点 )9 。 整 个 物品 集 表示 为 。 用 户 u 的 偏好 表示 为 
函数 fu (也 称 为 目标 函数 );， 为 了 简洁 起 见 ， 用 f 指 代目 标 用 户 。 物 品 z 的 评分 被 当 作 一 
个 输出 值 (或 者 标签 ) 用 y — f(x) 来 表示 。 每 个 物品 x Pe Ty ss 
2，…，5} 上 进行 评分 。 

在 监督 学 习 中 ， 物 品 和 相应 应 的 用 户 评分 通常 被 分 为 互补 的 两 部 分 一 一 训练 集合 测试 集 
(也 称 为 验证 集 )。 监 督学 习 的 任务 就 变 成 了 ， 在 给 定 一 个 训练 集 (通常 由 所 有 用 户 的 评分 
提供 ) 上 学 习 一 个 准确 预测 用 户 偏 好 的 函数 六 训练 集 的 物品 表示 为 torsim ， 这 些 物品 以 及 
它们 相对 应 的 评分 构成 一 个 训练 集 ， 例 如 7 一 {(x*，Y)}sexcm 。 我 们 通过 泛 化 误差 来 衡 
量 学 习 函 数 预测 用 户 真实 偏好 的 准确 度 : 


日 ”表示 物品 的 方法 取决 于 推荐 系统 和 基本 的 预测 方法 。 在 基于 协同 过 滤 的 方法 中 ， 物 品 可 能 通过 用 户 的 评分 
来 表示 ， 或 者 在 基于 内 容 的 推荐 系统 中 ， 物 品 由 它们 的 描述 信息 来 表示 。 
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Gf) = 2) £Cf G0, f G0) P(x) (23. 1) 
然而 在 实际 中 ， 并 不 是 所 有 xc xit fGD. 因此 常用 测试 误差 来 近似 泛 化 误差 : 
C= MX Lœ), FP) (23. 2) 


其 中 xzereo 是 指 测试 集 物品 ， 预 测 误差 通过 利用 一 个 损失 函数 L 来 衡量 ， 如 绝对 平均 值 
(MAE): 
Lual f), fO) | £60 — f(x) | (23. 3) 
或 者 均 方 误差 (MSE) : 
Luse Cf x), F) =x) Fa)? (23. 4) 
主动 学 习 标 准 被 定义 用 来 评估 获取 物品 x EDA, FILMS Jm AVIA RX Tio 以 
获取 某 一 特定 目标 ( 见 23. 1. 1 节 )。 为 简单 起 见 ， 将 此 目标 设 为 学 习 函 数 在 训练 集 上 的 最 
小 化 泛 化 误差 。 我 们 将 主动 学 习 准 则 表示 为 


| GCA Trin U (x)) (23.5) 
或 为 简单 起 见 表示 为 
GG) (23. 6) 
主动 学 习 的 目标 为 选择 一 个 能 够 最 小 化 泛 化 误差 G(x) 的 物品 x: 
argmin, G(x) (28. T) 


如 果 要 求 用 户 对 x; 或 物品 x 进行 打分 ， 那 么 可 以 通过 一 个 主动 学 习 标 准 来 评估 它们 的 效 
FH. 例如，G(Cx;) 和 GCx,)， 选 一 个 可 以 使 得 泛 化 误差 更 小 的 物品 。 注 意 我 们 需要 在 未 知 一 
个 物品 的 真实 评分 时 评估 一 个 用 户 的 评分 。 为 区 别 候 选 评分 物品 与 其 他 物品 ， 我 们 将 其 表 
示 为 x*。。 只 要 提供 所 需 信 息 ， 主 动 学 习 可 以 应 用 到 任何 预测 方法 中 ， 例 如 ， 评 分 评估 [42] 
以 及 它们 的 分 布 [L23，25]、 近 似 决 策 边界 [55，15]、 方 法 参数 [49j 等 。 


x 单个 输入 (单个 物品 ) 
x 多 个 输入 (多 个 物品 ) 
y 输出 (物品 的 评分 ) 
2 一 (1，2，…，5) 可 能 的 输出 (评分 ) 例 y€ y 

f. 用 户 的 偏好 函数 (系统 未 知 ) 

XTrain 训练 集 输入 (已 被 评分 的 物品 ) 

T —(Gi, yi) xi Ex(Train) 训练 集 ( 物 品 及 其 评分 ) 

f 用 户 偏 好 的 近似 函数 (来 自 训练 集 ) 

_G 泛 化 误差 (预测 准确 度 ) ， 见 (23. 1 节 ) 
Xe 用 来 评分 的 物品 

GG) 主动 学 习 标准 (评估 物品 x 评分 的 效用 ) 

图 23.3 符号 总 结 


回归 和 分 类 ”预测 用 户 评分 问题 可 以 看 作 一 个 回归 或 分 类 问题 。 因 为 评分 是 离散 的 数 
值 ， 所 以 是 一 个 回归 问题 ， 例 如 ， 如 果 考 虑 它们 的 顺序 属性 ， 意 味 着 评分 可 以 排序 (如 评 
分 4 比 评分 3 高 )。 另 外 可 以 忽略 评分 的 数值 属性 ， 通 过 将 评分 看 作 类 /标签 ， 把 该 问题 当 
作 一 个 分 类 问题 s 。 例 如， 可 以 使 用 最 近邻 (NN) 方 法 来 分 类 ， 如 从 邻居 中 提取 频率 最 高 


日 ”如 果 考 虞 标签 的 顺序 属性 ， 则 称 为 有 序 分 类 。 
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的 标签 ， 或 者 还 可 以 用 NN 进行 回归 ， 如 计算 邻居 评分 的 平均 值 。 在 本 章 使 用 分 类 和 回归 
的 例子 ， 选 择 其 中 最 合适 的 帮助 解释 。 


23.5 基于 不 确定 性 的 主动 学 习 


基于 不 确定 性 的 主动 学 习 尝试 获取 训练 点 来 减少 某 些 方 面 的 不 确定 性 ， 例 如 ， 与 输出 
值 相关 [28]、 模 型 参数 [23] 和 决策 边界 [45j] 等 。 该 方法 的 一 个 潜在 缺点 是 降低 不 确定 性 并 
不 总 是 有 效 。 如 果 一 个 系统 能 够 确定 用 户 评分 ， 这 并 不 意味 着 一 定 是 准确 的 ， 因 为 有 可 能 
只 确定 错误 的 内 容 ( 例 如 ， 如 果 算 法 错 了 ， 减 少 再 多 不 确定 性 也 毫 无 帮助 ) 。 举 个 例子 ， 如 
果 用 户 到 目前 为 止 评分 一 直 比 较 正 面 ， 那 么 系统 可 能 误 以 为 该 用 户 喜 欢 所 有 的 物品 ， 这 可 
能 很 不 正确 。 l 


23.5.1 输出 不 确定 性 


在 基于 输出 不 确定 性 的 方法 中 ， 标 记 选 择 的 物品 (训练 集 ) 来 减少 训练 物品 的 预测 评分 
不 确定 性 。 在 图 23. 1 中 ， 假 设 推荐 系统 在 物品 归属 类 的 基础 上 评估 物品 的 评分 (例如 ， 相 
同类 别 的 电影 得 分 相同 )， 如 果 已 经 得 到 了 某 用 户 对 一 部 科幻 类 (右上 方 ) 电 影 的 评分 ， 那 
么 推荐 系统 很 有 可 能 更 加 确定 其 他 科幻 类 电影 的 评分 ， 并 有 利于 获取 用 户 对 还 未 抽样 的 某 
个 类 别 ( 聚 类 ) 中 电影 的 评分 ， 如 还 未 确定 的 聚 类 。 

基于 实例 和 模型 的 输出 不 确定 性 主动 学 习 方法 之 间 的 主要 不 同 之 处 在 于 ， 对 于 任 一 项 
x， 评 分 分 布 函数 P(Y,) 是 如 何 获 得 的 ， 其 中 评分 分 布 是 指 某 个 物品 被 赋值 为 某 个 评分 的 
概率 。 基 于 模型 的 方法 可 以 通过 模型 获取 评分 分 布 。 由 于 概率 模型 直接 提供 评分 分 布 ， 所 
以 特别 适合 这 种 情况 L23，25] 。 

对 于 基于 实例 的 方法 ， 通 过 收集 数据 来 获取 评分 分 布 。 例 如 ， 使 用 最 近邻 技术 的 方法 在 
邻居 投票 的 基础 上 获取 评分 分 布 ， 其 中 这 里 的 “邻居 "是 指 具 有 相似 偏好 的 用 户 ， 公 式 如 下 : 


| PCY, = y) = 7 (23. 8) 
Hp, NN, 是 为 物品 z 打 过 分 的 邻居 ，NANN;,, 是 给 定 物 品 z 评分 为 y ABE, wm WBE 
的 权重 (如 相似 度 )。 
23.5.1.1 主动 学 习 方 法 
一 些 主动 学 习 方 法 [28] 通 过 计算 输出 值 的 不 确定 性 的 本 地 ( 贪 焚 ) 方 法 来 评估 一 个 潜在 
训练 集 的 效用 : 
人 Di (X,) — —UncertaintyCY,) (23. 9) 
由 于 我 们 的 目标 是 最 小 化 G， 那 么 对 物品 评分 具有 较 高 不 确定 性 是 有 利 的， 这 将 消除 被 选 
物品 评分 的 不 确定 性 。 但 标记 评分 不 确定 的 物品 并 不 能 达到 减少 其 他 物品 评分 不 确定 性 的 
目标 (例如 ， 标 记 离 群 点 只 会 减少 其 他 类 似 物品 的 不 确定 性 ， 就 像 表 23. 1 中 ， 选 择 僵 尸 类 
型 的 物品 (c) 一 样 ， 或 者 甚至 在 (d) 中 什么 也 没 选 ) 。 
因此 我 们 可 能 要 考虑 通过 选择 能 够 降低 其 他 未 评分 物品 不 确定 性 的 全 局 方式 来 降低 不 
确定 性 。 这 样 做 的 一 种 方法 [40] 是 ， 通 过 在 整个 测试 集 #ereo 上 相对 于 潜在 训练 物品 xa 计 
算 评分 的 不 确定 性 来 定义 规则 : 
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1 


= | zereo | 
xE 


9] Ero (Uncertainty (Yx)) (23. 10) 


x Test) 


其 中 TesT 归 一 化 因子 ，Erw (Uncertainty(Y,)) 表 示 不 确定 性 的 期 望 值 ， 其 中 将 候选 物 


品 z。 的 评估 评分 y, 加 入 训练 集 T， 如 TCa) 二 TU (x。，y)。 

非 本 地 化 方法 有 一 个 潜在 的 缺点 ， 即 对 于 本 地 化 方法 只 需要 评估 单个 输出 值 ys 的 不 
确定 性 ， 而 对 于 非 本 地 化 方法 则 需要 评估 对 潜在 训练 集 (x。，y) 的 所 有 训练 集 输 出 值 的 不 
确定 性 。 这 有 可 能 难以 正确 地 评估 并 且 计 算 昂 贵 。 
23.5.1.2 不 确定 性 度量 

物品 评分 (输出 值 ) 的 不 确定 性 通常 通过 其 方差 、 科 [28] 或 者 置信 区 间 [38] 来 计算 。 当 
评分 最 大 程度 偏离 平均 值 时 方差 最 大 ， 当 所 有 评分 差不多 时 焙 被 最 大 化 。 

输出 值 的 不 确定 性 可 以 用 下 式 中 的 方差 定义 来 计算 : 

Uncertainty(Y,) = VAR(Y,) = $) (y — Y.) P(Y.-,) (23. 11) 


yey 


其 中 Y。 表 示 物 品 x。 上 所 有 用 户 的 平均 评分 ，P(Y, 二 y) 是 物品 评分 Y。 Sy 相等 的 概率 ， 
二 者 要 么 是 在 基于 实例 的 最 近邻 方法 的 基础 上 进行 计算 的 ， 要 么 是 从 基于 模型 方法 的 模型 
中 获取 的 。 

不 确定 性 也 可 以 由 如 下 式 的 粹 进行 计算 : 


Ginen x; ) 


Uncertainty(Y,) = ENT(Y,) =— >) P(¥.-,) log PCY gay) (23. 12) 
yey 
文献 [47] 中 提出 一 个 基于 最 相似 评分 概率 计算 评分 不 确定 性 的 方法 : 
Uncertainty(Y,) =—P(Y,=y" ) (23. 13) 


其 中 y" =argmaxy P(Y, =y) 是 最 相似 评分 。 
在 文献 [38j 中 置信 区 间 在 计算 选择 训练 输入 集 时 用 来 计算 不 确定 性 : 

co POLY S y LOL) (23. 14) 
其 中 < 是 实际 评分 y。 位 于 下 界 b,(Y。) 和 上 界 六 (Y.) 之 间 的 置信 和 度 。 例 如 ， 系 统 可 以 确定 
物品 有 c 二 90% 的 概率 被 评分 为 3 一 5。 许 多 方法 偏爱 上 界 较 高 的 物品 ， 这 表明 该 物品 可 能 
评分 比较 高 (对 开发 有 益 ) ， 而 且 如 果 置 信 区 间 也 比较 大 ， 那 么 也 有 可 能 利于 探索 。 在 某 些 
时 候 ， 理 想 的 情况 是 增加 预测 评分 比较 高 的 物品 数量 ， 在 置信 区 间 的 下 界 使 用 期 望 值 有 利 
于 物品 选择 ， 期 望 值 越 高 情况 越 理 想 。 


23.5.2 决策 边界 不 确定 性 


在 基于 决策 边界 的 方法 中 ， 选 择 训 练 集 来 改善 决策 边界 。 通 常 现 有 的 决策 边界 被 认 
为 有 几 分 正确 ， 所 以 采样 接近 决策 边界 的 点 以 进一步 修正 (图 23.4)。 从 某 种 程度 上 说 
这 也 可 以 被 认为 是 基于 输出 不 确定 性 ， 因 为 接近 决策 边界 的 集合 的 不 确定 性 可 能 比较 
高 。 该 方法 在 这 样 的 假设 上 进行 ， 基 础 学 习 方 法 (如 支持 向 量 机 ) 的 决策 边界 很 容易 得 
到 。 该 方法 的 一 个 明显 优势 是 给 定 一 个 决策 边界 ， 通 过 近似 决策 边界 来 选择 训练 样本 的 
计算 开销 小 。 

正如 文献 L45] 中 所 讨论 的 一 样 ， 通 过 选择 训练 集 来 获取 更 准确 的 分 割 超 平面 
(图 23.4b)， 或 如 果 超 平面 的 方向 已 经 确定 ， 可 能 要 选择 输入 集 来 降低 边缘 的 大 小 
(E23. 4c) 。 虽 然 在 靠近 决策 边界 抽取 训练 集 比 较 好 是 显而易见 的 [55,， 15], 但 是 也 有 其 
他 方法 是 选择 远离 边界 的 物品 [15]， 这 些 物品 在 涉及 多 个 候选 分 类 的 情况 下 有 洪 在 的 优 
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势 ， 这 将 在 23.7 节 进 行 讨论 。 这 是 因为 一 个 分 类 应 该 对 任何 远离 决策 边界 的 物品 都 非常 
确定 ， 但 是 如 果 新 获取 的 训练 数据 显示 分 类 不 准确 ， 那 么 该 分 类 可 能 不 适合 该 用 户 偏好 ， 
所 以 应 该 从 候选 分 类 池 中 删 掉 该 分 类 。 


o 候选 训练 输入 值 

-- 当前 决策 边界 

一 新 / 重 定义 决策 

© o |. | 国 
o 

e : 





b) c) 
图 23.4 决策 边界 不 确定 性 


23.5.3 模型 不 确定 性 


基于 模型 不 确定 性 方法 选择 训练 集 来 降低 模型 内 的 不 确定 性 ， 更 具体 地 说 是 为 了 降低 
模型 参数 的 不 确定 性 。 这 里 假设 如 果 提 高 了 模型 参数 的 准确 性 输出 值 的 准确 性 也 会 随 之 提 
高 。 如 果 我 们 基于 不 同 兴趣 组 的 成 员 预 测 一 个 用 户 的 偏好 [23]， 如 一 组 具有 相似 兴趣 的 用 
户 ， 那 么 选择 的 训练 集 用 来 决定 该 用 户 属 于 哪 一 组 。 
23.5.3.1 概率 模型 


下 面 的 例子 能 够 很 好 地 解释 概率 模型 。 主 题 模 型 [23] 是 一 个 概率 潜在 语义 模型 ， 其 中 
用 户 被 看 作 多 重 兴 趣 ( 称 为 主题 ) 的 混合 ， 该 模型 是 一 个 不 错 的 例子 。 对 于 每 个 UCU 在 不 
同 兴趣 组 xE Z 上 有 一 个 概率 分 布 。 相 同 兴趣 组 的 用 户 被 认为 有 相同 评分 形式 (例如 ， 同 一 
视 面 的 两 个 用 户 会 对 给 定 电 影评 分 相同 ) ， 所 以 对 于 给 定 隐 类 别 变量 PA x € xp 
品 是 相互 独立 的 。 用 户 u 为 物品 x 评分 为 y 的 概率 可 以 通过 下 式 来 计算 : 
P(y|x,u) = >)P(y|x,z)PCz|z) (23. 15) 
z€Z 


第 一 项 p(y|x，z) 是 分 类 z 中 的 用 户 为 物品 x 评分 y 的 似 然 (由 高 斯 分 布 近似 [23])， 该 项 
不 依赖 目标 用 户 ， 代 表 了 特定 组 的 模型 。 第 二 项 p(z|u) 是 目标 用 户 u 属于 类 别 z 的 概率 ， 
称 为 用 户 个 性 化 参数 (由 多 项 分 布 近似 [23]) 。 用 户 模型 9, 由 一 个 或 多 个 用 户 个 性 化 参数 
组 成 ， 如 0. 王 (0. —pGlu))z€Z. 
一 个 传统 的 主动 学 习 方 法 根据 能 够 使 用 户 模型 参数 bu 减少 多 少 不 确 定性 来 衡量 候选 
训练 输入 点 zx。 是 否 有 用 (例如 ， 用 户 x 属于 兴趣 组 z 的 不 确定 性 ) : 
Gouncertainy (Xa ) = Uncertainty(@, ) (23. 16) 
Uncertainty(@,) =— ( 956, |... log6, |... EN " (23. 17) 
其 中 9, 表示 目前 用 户 u 的 估计 参数 ，b.-|z。，y 是 通过 额外 的 训练 点 (x。，y) 估 计 的 参数 。 
由 于 上 述 标准 的 目的 是 降低 目标 用 户 属 于 哪个 兴趣 组 的 不 确定 性 ， 所 以 将 用 户 分 配 到 单个 
兴趣 分 类 有 益 于 训练 集 。 这 个 方法 可 能 并 不 是 对 所 有 模型 都 有 效 的 ， 比 如 ， 主 题 模型 中 将 
用 户 分 配给 多 个 兴趣 组 更 有 利于 用 户 偏好 的 建 模 [23，25j。 
根据 当前 估计 的 模型 0, 计算 分 布 p(y|x，9.) 不 确定 性 的 期 望 是 另 一 个 潜在 的 缺陷 。 
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目前 估计 的 模型 可 能 与 真实 模型 有 很 大 差距 ， 特 别 是 训练 集 数量 小 而 需要 估计 的 参数 数量 
很 大 的 时 候 。 因 此 ， 仅 在 单个 估计 模型 上 执行 主动 学 习 方 法 可 能 是 有 误导 性 的 [25]。 让 我 
们 通过 图 23. 5 中 的 例子 进行 说 明 。 用 实 线 表示 现 
有 的 四 个 训练 集 ， 虚 线 表示 测试 集 。 根 据 这 四 个 训 


inpru, 





的 模型 上 执行 主动 学 习 是 很 有 误导 性 的 ， 特 别 是 估 
计 的 模型 与 实际 模型 相差 很 大 时 。 一 个 更 好 的 策略 inpru, 
是 利用 模型 分 布 引入 模型 的 不 确定 性 来 选择 训练 输 图 23.5 当 评估 模型 与 实际 模型 差距 
入 集 [25]。 由 于 在 选择 训练 输入 集 时 不 仅 估 计 决 策 很 大 时 的 学 习 情境 。 训 练 集 
边界 (如 水 平 线 )， 同 时 其 他 决策 边界 也 被 考虑 在 用 实 线 框 表示 
内 ， 所 以 可 以 更 有 效 地 调整 该 决策 边界 。 该 方法 已 
经 应 用 在 文献 [25] 中 的 概率 模型 中 。 候 选 训练 集 的 效用 根据 其 相对 于 最 优 模型 参数 9." 所 
允许 模型 参数 0, 调整 的 程度 进行 评估 : 

Gaj eias a) — ( 2/0; log wee) "A (23. 18) 
式 (23.18) 相 当 于 当 k 散 度 ， 它 在 估计 的 模型 参数 等 于 最 优 参数 时 取 最 小 值 。 实 际 模型 
9," 未 知 ， 但 可 以 通过 用 户 模 型 如 p(9, |u) 的 后 验 分 布 上 的 期 望 值 来 估计 。 


23.6 基于 误差 的 主动 学 习 


基于 错误 的 主动 学 习 方法 旨 在 减少 预测 误差 ， 这 通常 也 是 最 终 目的 。 基 于 实例 的 方法 
试图 找到 训练 输入 集 与 预测 误差 之 间 的 关系 并 加 以 利用 。 基 于 模型 的 方法 趋向 于 减少 模型 
误差 (如 模型 参数 的 误差 )， 并 期 望 能 够 因此 改善 预测 误差 。 


23.6.1 基于 实例 的 方法 


正如 在 23.2 节 中 所 列 的 一 样 ， 基 于 实例 的 方法 旨 在 输入 集 属 性 的 基础 上 降低 误差 。 
23.6.1.1 输出 估计 变更 (Y 变更 ) 

文献 [42] 中 的 方法 在 这 样 一 个 准则 下 执行 ， 即 如 果 评 分 估计 不 变 ， 那 么 方法 就 没有 改 
善 。 因 此 如 果 输 出 值 的 估计 确实 改变 了 ， 那 么 这 些 输 出 值 的 正确 率 要 么 提高 了 要 么 降低 
了 。 然 而 ， 可 以 预计 到 该 方法 至 少 可 以 从 新 训练 集中 学 到 一 些 东 西 ， 那 么 可 见 在 许多 情况 
下 估计 实际 上 是 越 来 越 准 确 的 。 假 设 估 计 大 部 分 是 朝 着 有 利 的 方向 变化 的 ， 致 使 许多 估计 
发 生变 化 的 物品 将 使 得 许多 估计 得 到 改善 ， 并 被 认为 是 有 用 的 。 

举 个 例子 (图 23. 6)， 如 果 一 个 用 户 对 一 个 具有 代表 性 的 大 类 别 进行 评分 ， 如 科幻 电影 
《星球 大 战 》， 那 么 该 评分 (不 管 值 为 多 少 ) 有 可 能 会 影响 其 他 相关 物品 的 评分 估计 ， 换 句 话 
说 ,为 这 样 一 个 具有 代表 性 的 物品 评分 对 于 用 户 偏好 是 非常 具有 信息 量 的 。 另 一 方面 ， 用 
户 对 没有 许多 相似 物品 的 物品 进行 评分 ， 如 电影 (金鱼 猎人 》， 对 评分 估计 不 会 带 来 很 大 影 


练 集 ， 最 可 能 的 决策 边界 是 水 平 线 (虚线 ) MEA Sb 2 

实 的 决策 边界 是 垂直 线 ( 实 线 ) 。 如 果 只 通过 该 估计 bab a Sh s 
的 模型 选择 训练 集 ， 接 下 来 的 获取 的 训练 集 就 可 能 | iii m raan. 
是 沿 着 评估 边界 ， 而 根据 正确 的 决策 边界 (垂直 线 ) d D 
这 些 训练 集 对 于 调整 评估 决策 边界 (水 平 线 ) 是 无 效 | 

的 。 该 例子 说 明 未 考虑 模型 不 确定 性 就 在 当前 估计 Lie P 
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响 ， 同 时 提供 的 信息 也 很 少 。 
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闫 评分 评估 变化 
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x: 物品 索引 
b) 


Ed 23.6 基于 输出 估计 的 主动 学 习 方 法 ( 见 23. 6. 1. 1 节 )。X 轴 对 应 物品 下 标 ，y 轴 对 一 个 应 候 
选 训练 点 的 评分 评估 变化 。 评 分 评估 中 变化 很 多 的 训练 集 被 认为 更 有 用 


为 找到 候选 物品 引起 的 评分 估计 的 期 望 变化 ， 所 有 可 能 的 物品 评分 都 应 纳 人 考虑 ( 即 
使 该 物品 的 真正 评分 未 知 )。 每 个 物品 的 每 个 可 能 评分 的 估计 之 间 的 差异 在 物品 被 添加 到 
训练 集 之 前 和 之 后 进行 计算 (参照 算法 1 的 伪 代 码 )。 

以 上 标准 可 以 更 正式 地 描述 为 

Grine 96-23 Eey Lf (Rs Pros Q0 (23. 19) 


x€ x(CTeso 


EPI (x) 表示 在 给 定 当前 训练 集 T 时 物品 x REA Prue p CO EH x, 的 
假设 评分 加 入 训练 集 T 后 的 评分 估计 ，L 是 计算 评分 估计 户 (x) 和 方 uo ,s(x) 差 异 的 损失 
函数 。 通 过 假设 一 个 候选 物品 的 评分 有 同等 机 会 并 使 用 平均 平方 函数 ， 上 述 标准 可 以 
写 为 | 


onu y Ty 220 09 = Tru, 0 (23. 20) 


x€ CTesD 


其 中 二 是 一 个 归 一 化 常量 ， 因 为 我 们 假设 所 有 物品 x WPAN yE. 


该 标准 的 优势 是 它 只 依赖 于 评分 的 估计 ， 可 以 从 任何 学 习 方法 中 获取 。 还 有 一 个 区 别 
于 其 他 只 考虑 一 小 部 分 物品 (被 用 户 评 过 分 的 物品 ) 的 方法 的 优势 ， 即 利用 所 有 未 评分 物 
the 。 该 标准 还 配合 其 他 任何 学 习 方法 ， 使 得 它 有 适应 不 同 任务 的 潜力 。 
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23. 6. 1.2 基于 交叉 验证 的 方法 
在 该 方法 中 训练 输入 点 的 选择 是 基于 训练 输入 点 能 否 很 好 地 近似 已 知 评分 ， 例如， 文 
献 [15] 训 练 集中 的 物品 。 


算法 1 基于 输出 估计 的 主动 学 习 ( 见 23. 6. 1. 1 节 ) 
# 人 估计 为 物品 x. 评分 时 可 能 会 得 到 的 预测 误差 
function G(x,) 
# 在 当前 训练 集 工 的 基础 上 学 习 一 个 偏好 近似 函数 
Fy =learn(T) 
# 对 于 物品 x. 的 每 个 可 能 的 评分 ， 如 {1，2，…，5} 
对 于 ya Ey 
# 添加 一 个 假想 训练 集 (x。，y。) 
TOSTU Ja) 
# 在 新 的 训练 集 厂 “上 学 习 一 个 新 的 偏好 预测 函数 广 
Frea 7 learnC T  ) 
# 对 于 每 个 未 被 评分 的 物品 
for xE XT 
# 在 为 训练 集 工 添加 假设 训练 集 (zae，ya) 之 前 或 之 后 ， 记 录 评 分 估计 间 的 差异 
6-64 C7 GE G0 — Fra 002) 


^ 
return G 


也 就 是 ， 将 了 一 个 具有 评分 概率 为 y € y 的 候选 训练 集 x 加 入 训练 集 7， 然 后 在 训练 集 
X(Train) 上 获取 用 户 偏好 并 计算 其 准确 率 (如 交 又 验证 )。 假 设 候选 训练 物品 包含 其 真正 的 
评分 时 ， 交 又 验 证 的 准确 率 将 得 到 最 大 改进 。 候 选 训练 集 的 效用 通过 交叉 验证 的 准确 率 改 
进 进行 计算 ,如 下 式 所 示 : 


Ge, (Xa) =— max D>) LC frya.y (2) f(z)) (23. 21) 


yey (Train) 
其 中 L 是 损失 函数 如 MAE 或 MSE( 见 23.4 45), fO Wah x WARES. Frua.» GO 
是 评分 的 近似 (其 中 7 是 从 训练 集 7U (zs。，y) 学 习 而 来 的 )。 
一 个 潜在 的 缺点 是 该 主动 学 习 方 法 选择 的 训练 点 对 训练 集 可 能 过 拟 合 。 


23.6.2 基于 模型 的 方法 


在 基于 模型 的 方法 中 ， 获 取 训 练 集 来 降低 模型 误差 ， 如 模型 参数 的 误差 。 这 种 方法 的 
一 个 潜在 的 缺点 是 降低 模型 误差 不 一 定 会 降低 预测 误差 即 主动 学 习 的 目标 。 
23.6.2.1 基于 参数 变化 的 方法 
基于 参数 变化 的 主动 学 习 方法 [49] 喜 欢 最 有 可 能 影响 模型 的 物品 。 假 设 这 些 模型 参数 
变化 是 有 利 的 ， 例 如 ， 最 优 参数 方法 中 ， 选 择 对 模型 参数 影响 最 大 的 物品 是 有 益 的 ; 
Gus Us) e TB os BOO vrac o) (23. 22) 


其 中 gr 是 从 现 有 训练 集 7 中 估计 的 模型 参数 ，br U (x。，y) 是 在 物品 x. 的 假设 评分 加 入 训 
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练 集 T 后 评估 的 模型 参数 ，L 是 计算 参数 之 间 差 异 的 损失 函数 。 
23.6.2.2 基于 方差 的 方法 
在 该 方法 中 ， 误 差 被 分 解 为 三 部 分 : 模型 误差 C( 在 给 定 当前 模型 上 最 优 函 数 近 似 值 g 
和 实际 函数 f 的 差异 )、 偏 差 B( 当 前 近似 值 与 最 优 值 g 的 差异 ) 和 方差 V( 近 似 函 数 让 的 
变化 大 小 ) 。 换 句 话说 有 
G=C+B+V (23. 23) 
有 一 个 解决 方法 [13] 是 通过 假设 偏差 
部 分 可 以 忽略 (如 果 该 假设 不 成 立 那 p 
么 该 方法 无 效 ) 来 最 小 化 误差 的 方差 ax 
部 分 。 有 很 多 方法 提议 选择 训练 集 来 » 
降低 模型 参数 方差 的 计算 。A 最 优 设 — pa ( fg VB... 
计 [11] 力 求 选择 训练 输入 集 来 最 小 化 
参数 估计 的 平均 方差 ，D 最 优 设计 


On 






[26 力求 最 大 化 参数 估计 的 香农 信息 解决 方案 空间 

差 以 及 推导 式 实验 (Transductive Ex- 图 23.7 将 泛 化 误差 G 分 解 为 模型 误差 C、 偏 差 B 和 方差 
perimental) 设 计 [56] 致 力 于 寻找 能 够 V， 其 中 & 表示 最 优 方法 ，7 是 学 习 方 法 ， 了 i 是 
保留 测试 集 大 部 分 信息 的 且 具 有 代表 训练 集 有 少量 变化 不 同 的 学 习 方法 


性 的 训练 集 。 文 献 [51] 中 的 主动 学 习 
方法 ， 除 了 方差 部 分 ， 还 将 模型 误差 的 存在 性 考虑 在 内 。 
23.6.2.3 基于 图 像 恢 复 的 方法 

也 可 以 将 预测 用 户 偏好 的 问题 看 作 图 像 恢 复 问 题 L34]， 也 就 是 根据 有 限 的 用 户 偏 好 信 
息 ( 部 分 图 片 ) 尝 试 恢复 完整 的 用 户 喜 好 图 片 。 主 动 学 习 任 务 选择 能 够 使 我 们 恢复 最 好 的 用 
户 偏好 “图 片 ”? 的 训练 集 。 值 得 注意 的 地 方 是 该 方法 满足 23. 2 节 中 概述 的 属性 。 举 个 例子 ， 
如 果 一 个 区 域内 已 经 存在 一 个 点 ， 那 么 不 需要 邻居 集合 的 采样 就 可 以 恢复 该 区 域 的 图 片 。 
靠近 图 片 组 成 部 分 的 边缘 (决策 边界 ) 取 样 对 该 方法 有 利 。 


23.7 ”基于 组 合 的 主动 学 习 


有 时 候 使 用 模型 组 合 而 不 是 单一 的 模型 可 能 对 预测 用 户 偏好 是 有 益 的 ( 见 第 21 章 )。 在 
只 使 用 单个 模型 的 情况 下 ， 该 模型 是 从 多 个 候选 模型 中 精心 挑选 的 。 这 种 方法 的 主要 优势 是 
具有 这 样 的 前 提 ， 即 不 同 的 模型 更 适用 于 不 同 的 用 户 或 问题 。 例 如 ， 一 个 用 户 的 偏好 使 用 原 
型 模型 建 模 可 能 会 更 好 ， 而 另 一 个 用 户 的 偏好 使 用 最 近邻 模型 建 模 会 更 好 。 这 些 主动 学 习 方 
法 的 训练 集 必 须根 据 多 个 模型 ( 见 23. 7. 1 节 ) 或 者 多 个 候选 模型 (23. 7. 2 节 ) 进 行 选 择 。 


23.7.1 基于 模型 的 方法 


基于 模型 的 方法 中 ， 许 多 模型 组 成 一 个 由 模型 形成 的 “组 合 "， 在 某 种 意义 上 共同 选择 
训练 集 [50]。 这 些 方法 往往 在 以 下 方面 不 同 ， 1) 如 何 构 建 一 个 模型 组 合 ; 2) 如 何在 组 合成 
员 基 础 上 选择 训练 集 [46]。 正 如 文献 [46] 中 的 详细 说 明 ( 请 参考 更 详细 的 内 容 )， 组 合 查询 
方法 (QBC) 涉 及 维护 模型 组 合 ， 这 些 模型 是 在 同样 的 训练 数据 上 进行 训练 的 。 本 质 上 ， 它 
们 表示 了 数据 (由 模型 表示 ) 可 能 看 上 去 相互 矛盾 的 假设 。 于 是 该 组 合 的 成 员 投票 决定 如 何 
标记 潜在 的 输入 集 (“QBC” 中 的 “查询 ”)。 为 此 它们 最 不 一 致 的 输入 集 被 认为 信息 最 丰富 。 
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QBC 的 基础 前 提 是 最 小 化 版 本 空间 或 者 所 有 假设 的 子 集 与 收集 的 训练 数据 相 一 致 ， 然 后 
尽 可 能 地 限制 该 空间 的 大 小 ， 同 时 最 小 化 训练 输入 集 的 数量 。 换 句 话 说 ，QBC 在 争议 区 
域 进行 查询 来 改善 版 本 空间 。 

构建 模型 组 合 有 很 多 方法 ， 文 献 [46] 中 提供 许多 实例 。 例 如 ， 可 以 通过 简单 的 抽样 进 
行 构建 [50]。 对 于 生成 模型 类 ， 可 以 通过 随机 抽样 来 自 某 个 后 验 分 布 的 任意 数量 的 模型 来 
构建 ， 例 如 ， 朴 素 贝 叶 斯 模型 参数 上 的 狄 利克 雷 分 布 [31]， 或 使 用 正 态 分 布 抽样 隐 马 尔 可 
夫 模 型 (HMMD)[14]。 也 可 为 其 他 模型 分 类 构建 该 组 合 ( 如 奇异 或 非 概率 模型 )， 如 boos- 
ting 查询 和 bagging 查询 [1]， 利 用 boosting[17] 和 bagging[8] 组 合 学 习 方法 来 构建 组 合 。 
还 有 一 些 研究 [12] 为 利用 “最 特别 与 “最 普通 ”模型 相 结 合 的 (在 给 定 的 当前 训练 集 上 选择 
位 于 当前 版 本 空间 边界 之 间 的 模型 ) 神 经 网 络 使 用 选择 性 抽样 算法 。 

组 合 中 所 用 模型 的 适当 个 数 仍 无 定论 ， 但 即使 少量 模型 也 可 以 得 到 好 的 结果 [50，31，47]。 

计算 模型 之 间 的 差异 是 组 合 方法 的 基础 ， 有 两 种 方法 可 以 计算 差异 : 投票 不 确定 性 
[14] 和 平均 KL 散 度 [31]。 投 票 不 确定 性 选择 组 合 中 模型 的 差异 最 大 的 点 。KL 散 度 是 两 
个 概率 分 布 之 间 差 异 的 信息 论 度量 方式 。KL 散 度 从 组 合 一 致 的 分 布 与 差别 最 大 模型 间 的 
最 大 平均 差异 中 选择 输入 集 。 


23.7.2 基于 候选 的 方法 


不 同 的 模型 会 更 适用 于 不 同 的 用 户 或 不 同 的 问题 ( 见 第 2 章 )。 所 以 训练 集 的 选择 ( 主 
动 学 习 ) 和 模型 的 选择 ， 称 为 模型 选择 (MS) ， 都 会 影响 学 习 到 的 函数 的 预测 准确 率 。 实 际 
上 主动 学 习 和 MS 间 有 很 强 的 依赖 性 ， 这 意味 着 对 某 个 模型 有 用 的 集合 对 其 他 模型 不 一 定 
有 用 (图 23. 9) 。 本 节 讨 论 如 何在 具有 多 个 模型 候选 以 及 过 程 中 可 能 出 现 的 问题 情况 下 执行 
主动 学 习 。 

模型 概念 具有 几 个 不 同 的 含义 。 我 们 可 能 将 一 个 模型 看 作 一 个 具有 一 些 共同 属性 的 函 
数 集 ， 例 如 ， 方 法 的 复杂 度 或 者 函数 或 学 习 方 法 的 类 型 (如 SVM、 朴 素 贝 叶 斯 、 最 近邻 或 
线性 回归 )。 函 数 的 不 同属 性 一 般 称 为 参数 。 因 此 给 定 一 个 模型 和 训练 数据 ，MS 的 任务 
是 找到 能 使 目标 函数 精确 估计 的 参数 。 所 有 模型 属性 都 影响 预测 准确 率 ， 但 是 为 简单 起 见 
我 们 只 着 重 于 模型 的 复杂 度 。 

如 图 23.8 所 示 ， 如 果 模 型 与 目标 函数 相 比 太 过 简单 使 其 从 拟 合 (图 23. 8a) ， 那 么 该 学 
习 函 数 可 能 不 能 用 来 近似 目标 函数 。 另 一 方面 ， 如 果 模 型 太 过 复杂 ， 它 可 能 会 尝试 近似 不 
相关 的 信息 (如 可 能 包含 在 输出 值 的 噪声 )， 这 将 导致 学 习 函 数 过 度 拟 合 目标 函数 (图 
23. 8b) 。 一 个 可 行 的 解决 方法 是 包含 许多 候选 模型 。 因 此 模型 选择 (MS) 的 目的 是 决定 组 
合 中 模型 的 权重 或 者 在 只 使 用 一 个 模型 的 情况 下 选择 一 个 合适 的 (图 23. 80 。 

minG(M) (23. 24) 






E 一 目标 函数 
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x 


输出 


输入 
a) 贝 拟 合 b) 过 度 拟 合 c) 合适 的 拟 合 


图 23.8 模型 复杂 度 和 准确 率 间 的 依赖 
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主动 学 习 的 任务 同样 是 最 小 化 预测 误差 ， 但 只 就 训练 集 的 选择 而 言 : 


min G(X Thaim ) (23. 25) 
鉴于 主动 学 习 和 MS 有 着 共同 的 目标 即 最 小 化 预测 误差 ， 把 二 者 结合 起 来 会 是 有 利 的 : 
min GC , M) (23. 26) 


理想 情况 下 我 们 会 通过 MS 方法 选择 复杂 度 合适 的 模型 以 及 使 用 主动 学 习 方法 选择 最 
有 用 的 训练 数据 。 然 而 由 于 如 下 的 悖 论 ， 只 是 批量 地 结合 主动 学 习 和 MS 方法 并 不 可 行 ， 
如 一 次 性 选择 所 要 训练 集 : 
。 为 通过 标准 主动 学 习 方 法 选择 训练 输入 集 ， 模 型 必须 固定 。 换 句 话 说 ，MS 方法 
已 经 执行 过 ( 见 图 23.9). 





图 23.9 对 一 个 模型 有 利 的 训练 输入 集 不 一 定 对 其 他 模型 有 利 


。 为 通过 标准 MS 方法 选择 模型 ， 训 练 输入 集 必须 固定 且 对 应 的 训练 输出 值 必须 合 
并 。 换 句 话 说， 主动 学 习 方 法 必须 已 经 执行 过 ( 见 图 23. 10) 。 





图 23. 10 主动 学 习 中 的 模型 选择 的 依赖 性 


最 终 批 量 主动 学 习 以 一 个 随机 选择 模式 来 选择 训练 集 ， 但 如 果 最 初 和 最 后 的 模型 不 
同 ， 训 练 集 可 能 不 会 那么 有 用 ， 因 此 获取 到 训练 集 之 后 需要 再 次 选择 该 模型 。 这 意味 着 训 
练 集 可 能 会 过 度 拟 合 或 不 充分 拟 合 为 劣质 模型 。 

对 于 顺序 主动 学 习 ， 在 选择 模型 过 程 中 训练 集 和 模型 采取 增 量 的 过 程 ， 即 选择 模型 然 
后 为 模型 选择 训练 集 ， 依 次 类 推 。 虽然 该 方法 是 直观 的 ,但 有 可 能 由 于 具有 在 整个 学 习 过 
程 中 选择 的 模型 不 断 变化 导致 的 模型 漂移 使 得 该 方法 的 表现 会 比较 差 。 随 着 训练 集 数 量 的 
增加 ， 更 多 复杂 模型 能 够 更 好 地 拟 合 数据 ， 因 此 选择 复杂 模型 而 不 是 简单 模型 。 由 于 训练 
输入 集 的 选择 取决 于 模型 ， 为 学 习 过 程 前 期 简单 模型 选择 的 训练 集 对 后 期 复杂 模型 可 能 没 
有 用 。 由 于 模型 漂移 ， 为 不 同 模型 收集 部 分 训练 集 ， 导 致 训练 数据 不 适合 其 中 任何 模型 。 
然而 因为 一 开始 最 终 模型 的 选择 并 不 确定 ， 有 一 种 可 能 性 是 通过 为 所 有 模型 优化 训练 数据 
在 多 个 模型 上 [52j 选 择 训练 输入 集 : 

min >) G(X Tan , M)wC(M) (23. 27) 


其 中 w(M) 作 为 组 合 或 候选 中 模型 的 权重 。 这 人 允许 每 个 模型 都 可 以 优化 训练 数据 ， 因 此 可 
以 避免 过 度 拟 合 训练 集 为 劣质 模型 的 可 能 风险 。 
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为 模型 AL 
选择 训练 点 


图 23.11 顺序 主动 学 习 


选择 模型 为 模型 AL 选择 选择 最 终 
^ MS É 所 有 训练 点 模型 MS 


图 23.12 批量 主动 学 习 


23.8 基于 会 话 的 主动 学 习 


与 标准 主动 学 习 方 法 以 获取 不 同 物品 的 评分 (为 提高 整个 集合 上 的 预测 准确 度 ) 为 目 
标 不 同 ， 基 于 会 话 的 主动 学 习 是 面向 目标 的 ， 开 始 的 时 候 都 很 宽泛 ， 经 过 一 系列 的 交互 
周期 缩小 用 户 兴趣 范围 直到 获得 所 需要 的 物品 [32，37，9]， 就 像 在 旅行 中 选 旅店 。 实 
质 上 该 目标 是 为 用 户 提供 能 够 使 他 们 减少 可 能 的 物品 集合 的 信息 来 寻找 最 有 效用 的 物 
品 。 因 而 该 系统 是 以 为 物品 提供 正确 预测 为 目标 的 ， 这 些 物品 是 潜在 的 小 组 物品 中 效用 
最 高 的 ， 如 在 指定 的 地 区 查询 餐馆 。 一 个 常用 的 方法 是 迭代 为 用 户 展示 可 变 的 推荐 集 
合 ， 并 通过 取得 反馈 来 指导 用 户 迈 向 最 终 目 标 ， 其 中 兴趣 范围 降低 为 单个 物品 。 由 于 一 
开始 用 户 几 乎 不 知道 自己 的 偏好 ( 变 得 有 主见 )， 但 在 决策 制定 过 程 倾向 于 形成 与 加 强 偏 
好 (探索 )， 因 此 这 个 基于 循环 的 方法 是 有 用 的 。 因 此 基于 会 话 的 主动 学 习 允 许 用 户 以 适 
合 给 定 任务 的 方式 加 强 他 们 的 偏好 。 不 像 一 般 推荐 系统 ， 这 种 系统 也 特意 包含 主动 学 习 
方法 ， 因 为 用 户 偏好 是 从 主动 交互 中 学 习 而 来 的 。 在 达到 期 望 目标 之 前 ， 它 们 经 常用 预 
测 准确 率 和 交互 长 短 来 评估 。 


23.8.1 基于 实例 的 评论 


一 个 与 用 户 进行 会 话 的 方法 为 基于 实例 评论 的 方法 ， 该 方法 寻找 与 用 户 查询 或 属性 相 
似 的 实例 然后 引出 一 个 评论 来 改善 用 户 兴 趣 ( 见 [37] 及 第 3 章 )。 如 上 面 所 提 到 的 (23. 8 
节 )， 在 会 话 初始 时 用 户 并 不 需要 明确 地 定义 他 们 的 偏好 ， 这 可 能 对 面向 手机 设备 的 系统 
特别 有 益 。 每 一 步 迭 代 显示 系统 推荐 的 排名 列表 并 人 允许 用 户 评论 ， 这 将 促使 系统 重新 评估 
它 的 推荐 并 产生 一 个 新 的 排名 列表 。 当 不 满意 某 个 被 推荐 物品 的 特征 时 ， 通 过 引出 一 个 用 
户 评论 来 获取 最 终 目 标 要 比 通过 单纯 的 基于 相似 性 查询 修改 结合 推荐 建议 更 有 效 。 举 一 个 
用 户 评论 的 例子 ， 他 /她 可 能 会 添加 评论 “我 想 要 一 个 较 便宜 的 客房 ”或 “我 喜欢 提供 葡萄 酒 
的 旅馆 ”。 


23. 8.2 基于 多 样 性 的 方法 


为 用 户 提 供与 其 查询 相似 的 物品 是 重要 的 (23. 8. 1 节 )， 同 时 推荐 物品 集合 的 多 样 性 
也 值得 考虑 [32]。 这 是 因为 被 推荐 的 物品 互相 太 过 相似 ， 它 们 可 能 不 是 目前 的 搜索 空间 中 
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具有 代表 性 的 。 实 际 上 ， 被 推荐 的 物品 应 尽 可 能 地 具有 代表 性 和 多 样 性 ， 而 且 不 会 明显 地 
影响 它们 与 用 户 查询 的 相似 性 。 

在 用 户 偏好 形成 的 初始 阶段 为 其 提供 多 样 的 选择 尤其 重要 。 pos aie pe 
么 ， 提 供 尽 可 能 匹配 的 物品 是 合适 的 ， 并 且 使 用 的 主动 学 习 技 术 应 该 尝试 进行 这 种 区 分 ， 
WU, eee MOLAR A. 


23.8.3 基于 查询 编辑 的 方法 


男 一 种 方法 是 允许 用 户 重复 编辑 和 提交 搜索 ， 直 到 他 们 发 现 期 望 的 物品 L9]。 由 于 它 
是 一 个 迭代 的 过 程 ， 其 目标 是 在 用 户 找到 效用 最 高 的 物品 之 前 最 小 化 所 需 查询 数量 。 查 询 
的 效用 在 用 户 提 交 的 特定 查询 的 相似 度 和 满意 度 基础 上 来 评估 ， 通 过 观察 用 户 行为 和 推测 
与 物品 效用 有 关 的 用 户 偏 好 上 的 约束 及 更 新 用 户 模 型 来 完成 。 例 如 ， 一 个 用 户 可 能 会 查询 
带 有 空调 和 高 尔 夫 课程 的 旅馆 。 推 荐 系统 能 够 确定 这 个 条 件 是 可 以 满足 的 ， 并 进一步 推断 
该 用 户 可 能 会 加 一 个 旅馆 在 市 中 心 的 条 件 ， 而 没有 旅馆 符合 要 求 ， 所 以 系统 先发制人 告诉 
该 用 户 该 条 件 无 法 满足 以 防 浪费 用 户 精 力 。 推 荐 系统 也 可 能 推断 有 些 旅馆 自 带 泳池 、SPA 
和 餐馆， 只 需 稍微 增加 一 下 价钱 。 知 道 用 户 对 泳池 的 偏好 (对 其 他 选项 没有 )， 系 统 只 提供 
添加 泳池 选项 ， 因 为 这 可 能 会 增加 用 户 的 满意 度 ， 而 且 系统 不 提供 其 他 选项 ， 因为 可 能 会 
让 用 户 感觉 元 余 从 而 降低 整体 满意 度 。 


23.9 计算 因素 考虑 


考虑 主动 学 习 算法 的 计算 代价 也 是 很 重要 的 。 文 献 [40] 中 提出 很 多 降低 计算 需求 的 方 
法 ， 总 结 ( 并 做 一 些 补充 ) 如 下 : 
。 许多 主动 学 习 方 法 在 其 对 学 习 到 的 函数 的 期 望 效果 基础 上 选择 物品 。 这 可 能 需要 
重新 训练 每 个 候选 训练 物品 ， 所 以 有 效 地 增 量 训练 是 至 关 重 要 的 。 通 常 比 从 一 个 
大 的 集合 开始 这 种 循序 渐进 的 方法 的 成 本 更 低 。 

。 对 每 个 候选 物品 可 能 都 需要 重新 获取 评分 估计 。 同 样 也 使 用 增 量 方法 ， 因 为 只 有 
变化 的 估计 才 需 要 重新 获取 。 

。 只 对 受 包含 训练 点 影响 的 物品 以 增 量 方式 更 新 估计 错误 是 可 行 的 ， 实 际 上 这 些 只 
是 训练 点 附近 的 物品 或 者 没有 相似 特征 的 物品 。 一 个 常用 的 方法 是 为 快速 查询 使 
用 倒 排 索引 对 具有 相似 特征 的 物品 进行 分 组 。 

。 候选 训练 物品 的 期 望 效用 可 以 使 用 所 有 物品 的 子 集 进行 评估 。 

。 训练 集中 的 劣质 候选 可 以 通过 一 个 预 过 滤 步骤 进行 删 减 ， 该 步骤 根据 某 些 标 准 移 
除 劣质 候选 物品 ， 例 如 ， 过 滤 掉 使 用 用 户 无 法 阅读 的 语言 书写 的 书 。 对 于 该 任务 
次 优 主 动 学 习 方法 可 能 是 一 个 不 错 的 选择 。 


23.10 总结 


虽然 本 章 所 展示 的 主动 学 习 方法 集合 的 介绍 都 很 简单 ， 但 希望 已 经 阐述 明白 对 许多 系 
统 来 说 ， 即 推荐 系统 ， 主 动 学 习 不 仅 是 有 利 的 也 是 理想 的 方法 。 可 以 看 出 ， 由 于 个 体 特 
征 ， 或 由 于 业务 约束 、 首 选 系统 行为 、 用 户 经 验 或 以 上 条 件 的 组 合 (也 有 可 能 是 其 他 的 条 
件 )， 在 许多 情况 下 主动 学 习 方法 的 选择 很 大 程度 上 取决 于 必须 满足 的 具体 目标 ( 见 23. 1. 1 
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节 )。 除 了 主动 学 习 的 目标 ， 在 评估 任何 方法 的 使 用 和 权衡 计算 代价 ( 见 23. 9 节 ) 时 也 需要 
并 愤 。 尽 管 许多 讨论 过 的 方法 都 已 成 功 实现 ， 但 还 需要 简单 说 一 下 存在 的 问题 ， 或 为 其 他 
看 似 无 关 但 可 能 有 相似 解决 办 法 的 问题 寻找 解决 方法 (如 23. 6. 2. 3 节 中 的 图 像 恢 复方 法 )。 
我 们 还 涉及 基于 会 话 的 系统 ( 见 23. 8 节 )， 该 系统 与 传统 推荐 系统 不 同 ， 但 从 设计 上 就 包 
含 主动 学 习 概念 。 根 据 现 有 任务 ， 如 面向 具体 目标 的 辅助 系统 ， 该 系统 可 能 是 推荐 系统 的 
不 错 选择 。 

一 些 与 主动 学 习 相关 的 问题 在 统计 学 中 已 经 得 到 充分 的 研究 。 而 计算 机 科学 领域 情 
况 不 同 ， 还 需要 进行 研究 。 推 荐 系统 变化 非常 快 而 且 越 来 越 复杂 。 赢 得 Netflix 推荐 竞 
赛 是 一 个 关于 推荐 系统 的 例子 ， 其 中 多 种 预测 方法 通过 组 合 方法 集合 起 来 ( 见 第 5 章 )。 
鉴于 推荐 系统 中 预测 方法 的 高 变化 率 以 及 与 主动 学 习 的 复杂 交互 ， 越 来 越 需要 新 的 
方法 。 

提高 准确 率 通常 是 研究 的 着 重 之 处 。 而 仅仅 有 准确 率 并 不 能 增加 系统 的 用 户 黏 性 。 因 
为 系统 在 完成 主动 学 习 方法 时 还 需要 推荐 具有 高 新 颖 性 /惊喜 度 的 物品 、 提 高 覆盖 率 或 最 
大 化 利润 等 [14，21，33]。 经 常 被 主动 学 习 研 究 者 忽略 的 另 一 个 方面 是 可 以 使 用 户 与 主动 
学 习 的 交互 来 改进 性 能 的 方法 。 简 单 地 展示 物品 让 用 户 评 分 至 少 可 以 说 是 缺乏 创造 性 的 ， 
那么 一 定 有 更 好 的 方法 吗 ? 有 这 样 一 个 例子 ,文献 [3] 中 表明 使 用 正确 的 用 户 界面 甚至 像 
标记 图 片 这 样 的 小 事 可 以 是 有 趣 并 令 人 兴奋 的 。 只 是 使 用 正确 的 界面 主动 学 习 系 统 的 效用 
就 有 可 能 急剧 增加 。 

为 保证 主动 学 习 在 推荐 系统 中 的 长 期 使 用 ， 许 多 遗留 问题 必须 要 解决 。 通 过 点 滴 的 创 
新 和 艰苦 的 工作 ， 我 们 希望 看 到 主动 学 习 从 一 个 “繁重 的 过 程 ” 变 为 一 个 愉快 的 自我 发 现 和 
探索 的 过 程 ， 并 同时 满足 系统 目标 和 用 户 。 
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摘要 本章 主要 目标 是 对 多 准则 推荐 系统 进行 综述 。 首 先 ， 本 章 将 推荐 问题 定义 为 
多 准则 决策 问题 (Mutli-criteria Decision Making, MCDM), ， 并 回顾 了 用 来 支撑 多 准则 推 
荐 系统 实现 的 MCDM 方法 及 技术 。 接 着 本 章 将 围绕 一 类 称 为 多 准则 评分 推荐 系统 
(multi-criteria rating recommenders) 的 推荐 技术 ， 该 推荐 技术 通过 多 个 准则 的 评分 向 量 来 
建 模 用 户 对 每 个 项 目的 效用 ， 进 而 产生 推荐 。 文 中 总 结 了 已 有 的 利用 多 准则 评分 进行 预 
测 和 推荐 的 算法 。 最 后 ， 还 对 多 准则 推荐 系统 的 一 些 尚未 解决 的 问题 以 及 未 来 面临 的 挑 
战 进行 讨论 。 


24.1 简介 


推荐 问题 被 定义 为 一 种 用 来 帮助 社区 中 的 个 体 用 户 发 现 那 些 他 们 最 有 可 能 感 兴趣 或 者 
与 他 们 的 需求 相关 的 信息 和 物品 L4，39，72]j。 通 常 ， 假 设 系统 的 用 户 集 为 Users， 可 推荐 
的 候选 物品 集 为 Items， 效 用 函数 用 于 度量 推荐 物品 iG € Items) 与 用 户 wx(xE Users) 之 间 
的 适合 度 ， 定 义 为 : R: UsersXItems>R,, HR, 表示 在 一 定 范围 内 的 非 负 整数 或 实数 
[4]。 假 定 此 效用 函数 不 是 在 所 有 UsersX Items 空间 里 都 是 已 知 的 ， 而 是 仅 在 一 定 的 子 集 
范围 内 确定 的 。 因 此 ， 在 推荐 上 下 文中 ， 我 们 希望 每 个 用 户 u(u € Users) 都 能 够 : 四 对 于 
物品 :GE Items) 未 知 的 效用 函数 Ru, DHT; @ 选 择 一 个 或 一 组 物品 iC € Items), 
使 得 Ru, DASS AB. BU 
Vu € Users, = arg maxR(u,i) (24. 1) 


在 绝 大 多 数 的 推荐 系统 中 ， 效 用 函数 通常 认为 是 一 个 单 准则 值 ， 例 如 ， 一 个 用 户 对 一 
个 物品 的 整体 性 评估 或 评分 值 。 最 近 的 研究 表明 ， 这 一 假设 存在 一 定 的 局 限 性 [2，4， 
48]， 因 为 对 于 一 个 特定 的 用 户 而 言 ， 推 荐 物品 的 合适 度 可 能 不 仅 只 依赖 于 用 户 做 决策 时 
的 某 一 个 方面 考虑 。 尤 其 是 在 基于 其 他 用 户 观 点 的 推荐 系统 中 ， 多 重 准则 的 引入 可 以 影响 
用 户 自身 的 观点 ， 从 而 产生 更 准确 的 推荐 。 . 

因此 ， 多 准则 评分 (multi-criteria rating) 提供 的 额外 信息 可 以 改善 推荐 质量 ， 这 
是 由 于 它 能 够 反映 每 个 用 户 更 复杂 的 偏好 信息 。 下 面 是 关于 多 准则 评分 的 案例 说 
明 ， 在 传统 的 单 评 分 电影 推荐 系统 中 ， 用 户 x 对 他 看 过 的 电影 ;给 出 了 一 个 评分 ， 
记 作 R(u,，i)。 具 体 地 ， 假 设 推荐 系统 是 依据 那些 具有 相似 偏好 信息 的 用 户 对 这 部 
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电影 的 评分 来 预测 用 户 对 没有 观看 过 的 电影 的 评分 ， 通常 这 些 具 有 相似 偏好 信息 的 
用 户 被 称 作 “邻居 ”[71]。 因 此 为 了 获得 准确 的 预测 或 推荐 ,准确 确定 与 目标 用 户 
最 相似 的 用 户 群 的 能 力 对 产生 精确 预测 和 推荐 至 关 重 要 。 例 如 ， 两 个 用 户 和 ww' 观 
看 了 三 部 相同 的 电影 ， 两 人 对 每 一 部 电影 的 综合 满意 度 评分 都 为 6 分 (满分 10 分 )， 
于 是 这 两 个 用 户 就 可 以 认为 是 邻居 用 户 ， AP w 对 未 观看 电影 的 评分 可 以 依据 用 户 
wu 的 评分 来 预测 。 

相 比 之 下 ， 在 多 准则 评分 环境 中 ， 用 户 可 以 对 一 个 物品 的 多 个 属性 进行 评分 。 例 
如 ， 在 一 个 双 准 则 电影 推荐 系统 中 ， 用 户 可 以 对 电影 的 两 个 属性 (例如 ， 故 事情 节 和 视 
觉 效果 ) 给 出 自己 的 偏好 。 某 一 个 用 户 可 能 喜欢 一 部 电影 的 故事 情节 ， 而 不 喜欢 它 的 视 
HAR, PIM, Ru, 由 二 (9，3)。 如 果 我 们 简单 地 使 用 两 个 相同 权 值 的 评分 来 进行 推 
荐 ， 那 么 对 于 在 单一 评分 系统 中 综合 满意 度 为 6 分 (满分 10 分 ) 的 情况 ， 在 双 准 则 系统 
中 可 能 会 对 应 多 种 情况 : (9，3)，(6，6)，(4，8) 等 。 因 此 ， 尽 管 整体 满意 度 都 是 6， 
但 是 两 个 用 户 可 能 采用 完全 不 同 的 评分 模式 ， 例如， 对 于 同样 的 三 部 电影 ， 用 户 iF 
SEI, 3), (9, 3), (9, 3), MAP w 的 评分 是 (3，9)，(3，9)，(3，9)。 用 户 偏 
好 中 的 额外 信息 将 有 助 于 更 准确 地 对 用 户 的 偏好 建 模 ， 需 要 开发 新 的 推荐 技术 来 利用 这 
些 额 外 信息 。 由 于 多 准则 推荐 系统 的 重要 研究 价值 ， 已 经 在 推荐 系统 的 相关 文献 中 凸显 
出 来 成 为 一 个 研究 分 支 [2，4，48]。 在 后 续 章节 中 我 们 会 讲 到 ， 最 近 也 有 一 些 推荐 系统 
采用 了 多 准则 评分 来 替代 传统 的 单 准则 评分 。 所 以 本 章 主 要 目的 是 提供 一 个 多 准则 推荐 
系统 (multi-criteria recommender system) 的 综述 ， 特 别 是 多 准则 评分 (mnulti-criteria rating) 
方面 。 

本 章 的 后 续 部 分 组 织 安排 如 下 : 首先 ， 综述 了 在 多 准则 决策 (MCDM) 视 角 下 的 一 般 性 
推荐 问题 ， 并 论证 了 在 多 准则 环境 中 应 用 MCDM 方法 提升 推荐 能 力 的 可 行 性 ; 其 次 ,我 
们 关注 于 采用 多 准则 评分 这 一 特定 类 型 的 多 准则 推荐 系统 ， 称 为 多 准则 评分 推荐 系统 ， 尽 
管 这 类 系统 还 没有 被 广泛 研究 ， 但 是 它 对 于 推荐 性 能 的 改善 还 是 具有 很 大 的 潜力 的 。 我 们 
对 这 一 类 推荐 系统 的 算法 现状 进行 综述 。 最 后 ， 我 们 讨论 了 多 准则 推荐 系统 领域 的 研究 挑 
战 以 及 未 来 的 研究 方向 。 


24.2 推荐 作为 多 准则 决策 问题 


为 了 将 多 准则 引入 一 般 的 推荐 问题 ， 可 遵循 MCDM 的 经 典 方 法 之 一 。 为 了 便于 探讨 
MCDM 方法 和 技术 在 开发 推荐 系统 中 的 应 用 ， 我 们 在 决策 支持 中 的 通用 建 模 方法 中 ， 沿 
用 了 Bernard Roy(20 世纪 60 年 代 MCDM 研究 的 先驱 者 ) 提 出 的 步骤 和 符号 L77]。 这 一 讨 
论 同样 遵循 了 其 他 的 MCDM 建 模 方法 [24，34，95，97]。 本 节 的 范围 是 为 了 给 推荐 系统 
研究 人 员 在 考虑 设计 一 个 多 准则 推荐 系统 时 ， 提 供 一些 初 步 的 指导 。 

Roy[L77] 的 方法 在 分 析 决 策 支 持 过 程 中 包括 四 个 步骤 : 

。 定义 决策 目标 。 即 定义 制定 决策 所 依赖 的 候选 物品 集 和 推荐 决策 的 理论 依据 。 

。 定义 一 致 的 准则 簇 。 即 标识 和 指定 一 个 用 来 说 明 决 策 者 面 对 多 种 选择 的 偏好 的 函 

数 集 。 这 些 函 数 集 需要 涵盖 所 有 影响 推荐 决策 的 参量 ， 并 且 是 完整 和 无 元 余 的 。 

。 开发 一 个 全 局 性 的 偏好 模型 。 定 义 一 个 用 来 将 每 个 准则 的 偏好 集成 到 模型 中 函数 ， 

确定 决策 者 针对 一 个 候选 物品 整体 偏好 。 

。 选择 决策 支持 流程 。 确 切 地 说 ， 包 括 对 流程 、 方 法 或 者 软件 系统 的 设计 和 开发 ， 

以 用 来 支持 决策 者 对 不 同情 况 做 出 决策 。 
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我 们 在 24. 2. 1 节 中 简 述 上 述 步骤 是 如 何 适用 于 推荐 系统 的 。 
24. 2. 1 决策 目标 


在 推荐 系统 中 ， 决 策 目标 就 是 将 物品 i 放 到 所 有 候选 物品 的 哪个 集合 中 ， 这 个 集合 的 
元 素 在 相关 文献 中 称 为 可 选 物品 或 者 动作 [30]。 为 了 表达 决策 背后 的 理论 依据 ，Roy[L77] 
引入 了 决策 “问题 ”>(problematic) 的 概念 。 定 义 了 四 类 决策 问题 : 
。 选择 (choice) ， 关 注 于 在 候选 集中 选择 一 个 或 多 个 可 选项 作为 更 合适 的 选择 ; 
。 $y3 sorting) ， 指 的 是 将 可 选项 分 类 到 多 个 预先 定义 的 类 别 中 ; 
。 排序 (ranking)， 指 的 是 对 所 有 的 可 选项 由 好 到 坏 进行 排序 ; 
。 描述 (discription) ， 即 如 何 描述 它 与 准则 之 间 的 符合 度 。 
所 有 四 类 决策 问题 在 推荐 问题 中 都 是 适用 的 : 
。 为 特定 的 用 户 选择 并 推荐 一 个 或 多 个 更 合适 的 物品 ; 
。 分 类 ,根据 物品 的 适用 性 将 所 有 的 物品 分 到 预先 定义 的 类 别 中 ， 比 如 ， 按 照 “ 推 荐 
购买 物品 ”或 “推荐 浏览 物品 ”; 
。 针对 特定 的 用 户 ， 将 所 有 的 物品 从 最 合适 到 最 不 合适 进行 排序 ， 然 后 将 排 好 序 后 
的 推荐 结果 列表 展现 给 用 户 ; 
。 基于 每 个 准则 评估 ， 描 ` 述 特定 物品 是 如 何 适合 于 指定 用 户 的 。 也 相当 于 一 个 对 物 
品 性 能 在 所 有 准则 上 的 全 面 分 析 ， 描 述 一 个 物品 和 用 户 之 间 的 合适 度 ( 即 用 个 性 化 
方法 帮助 用 户 做 出 选择 ) 。 


24.2.2 ENR 


物品 集中 的 可 选项 的 效用 是 依据 每 个 用 户 的 准则 集 分 析 得 来 的 ， 以 便于 对 物品 所 
有 的 特征 、 属 性 、 效 果 或 因果 关系 建 模 L77，97]。 在 推荐 系统 中 ， 准 则 可 能 涉及 物 
品 的 多 个 特征 (通常 是 在 基于 内 容 的 推荐 中 )， 或 涉及 被 评估 或 评分 的 物品 的 多 个 
维度 。 
任何 一 个 准则 c 都 可 以 用 函数 g.(i) 用 来 表达 一 个 用 户 的 偏好 (由 用 户 自 定义 )， 以 便 
于 用 户 能 够 在 两 个 可 选项 i 和 i 之 间 做 出 决定 ， 若 g. G0 ge (D. WM i ip BAA 
P, E g.(i1) 二 g.(iz) 则 表示 这 两 个 物品 是 等 价 的 ( 即 在 这 个 准则 下 可 以 为 用 户 完美 替换 的 
选项 ) 。 为 了 能 在 多 准则 中 做 出 合理 的 抉择 ， 需 要 确保 整个 函数 集 创 建 了 一 致 性 的 准则 得 
[77]。 一 致 性 的 准则 簇 必须 满足 以 下 三 个 特性 : 
。 单调 性 (monotonic) ; 准则 得 的 单调 性 是 指 对 于 每 一 对 可 选项 和 ji ， 如 果 在 准则 
ak, 有 ga G0 Ec CG); 在 任何 其 他 准则 c 上 ， 有 g. G) Sg. Ci), cA; NI 
认为 ， 可 选项 二 比 更 适合 用 户 。 
。 完整 性 (exhaustive) ; AT 一 对 可 选项 记 和 i,， 如 果 在 每 一 
个 准则 c E, 有 g G,))—g.C352; MAK, LA 5ESE T. 
* FE Rt (non-redundant) ; ERN ISOLA ALAR RR, 都 会 
违背 其 他 两 条 特性 中 的 一 条 。 
在 本 章 的 剩余 部 分 ， 除 非特 别 说 明 ， 假 定 准 则 簇 & 为 一 致 性 的 准则 簇 ， 即 gl gz 
g83，…，&k。 在 现 有 的 一 些 推荐 系统 文献 里 ， 准 则 簇 的 一 致 性 的 设计 在 很 大 程度 上 都 被 忽 
略 了 ， 其 实 它 将 是 未 来 研究 中 的 一 个 非常 有 趣 和 重要 的 问题 。 在 MCDM 中 通常 有 四 种 类 
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型 的 准则 [30j]: 
。 可 度量 的 (measurable) ， 即 在 某 些 评价 标准 上 可 以 对 准则 进行 定量 的 度量 ; 
。 序数 化 的 (ordinal)， 即 准则 定义 的 有 序 集合 中 可 以 接受 的 值 ， 允 许 进行 定性 或 描 
述 性 的 评价 ; 
。 概率 化 的 (probabilistic)， 即 在 对 准则 的 评价 中 使 用 概率 分 布 表示 不 确定 性 ; 
。 模糊 性 的 (fuzzy)， 即 准则 的 量化 是 用 来 表示 它 所 使 用 的 定性 的 或 定量 的 量化 尺度 
之 间 的 可 能 性 关系 准则 的 评价 可 以 看 作 落 在 定性 或 描述 性 评价 的 某 个 区 间 概 率 的 
关系 。 
广义 上 来 讲 ， 准 则 簇 通 常 也 可 以 用 于 推荐 系统 ， 以 便 更 好 地 表达 用 户 的 偏好 。 因 此 ， 
我 们 可 以 假定 所 有 类 型 的 准则 都 可 以 用 于 多 准则 推荐 系统 , :尽管 有 些 类 型 ( 稍 后 说 明 ) 比 其 
他 类 型 在 当前 成 熟 系统 中 使 用 得 更 频繁 。 


24.2.3 全 局 偏好 模型 


全 局 偏好 模型 提供 了 一 种 把 每 个 准则 值 g-(c 王 1，…，&) 进 行 聚合 的 方法 ， 用 来 表达 
在 物品 集中 不 同 选 项 之 间 的 偏好 ， 它 取决 于 选择 问题 类 型 。 在 MCDM 文献 中 ， 提 出 了 多 
种 方法 ， 这 些 方法 可 以 依照 全 局 偏好 模型 的 使 用 以 及 创建 方式 被 分 成 不 同类 别 。 根 据 文献 
[30，64]j， 全 局 偏好 模型 可 以 分 为 以 下 几 类 

。 价值 导向 模型 (Value-Focused model) ， 它 构造 了 由 不 同 准则 的 用 户 偏好 聚合 而 产 

生 的 价值 体系 。 在 这 种 方法 中 ， 每 个 准则 上 的 边界 偏好 被 集成 为 一 个 总 价值 函数 ， 
这 一 函数 通常 称 为 效用 函数 (Utility Funcition)[33]， 这 些 方法 又 称 为 多 属性 效用 
理论 方法 (MAUT)。 

。 多 目标 优化 模型 (Multi-Objective Optimization modeD ， 它 的 准则 使 用 了 多 约束 条 件 对 

多 目标 优化 问题 的 这 种 表达 形式 。 该 方法 中 ， 目 标 通常 是 为 了 原始 优化 问题 去 寻找 
帕 雷 托 (Pareto) 最 优 解 决 方案 [102]。 该 类 方法 也 被 称 成 为 多 目标 数学 规划 方法 。 

。 级 别 优先 关系 模型 (Outranking Relations model) ， 在 该 模型 中 ， 偏 好 用 来 表示 物 
品 之 间 的 级 别 优先 关系 ， 因 此 允许 它们 有 不 可 比 性 。 在 这 类 方法 中 ， 所 有 的 物品 
都 是 成 对 元 素 之 间 的 互相 比较 ， 并 且 它 们 之 间 的 偏好 关系 用 关系 名 词 来 表示 为 ， 
如 “a 比 更 受 偏爱 ”，“a 与 b 同样 受 偏爱 ”， 或 “a 5b 无 法 相 比 ”[76j]。 

。 偏好 分 解 模型 (Preference Disaggregation model) ， 它 的 偏好 模型 是 经 过 对 以 往 决 
策 的 分 析 推 导 得 出 的 。 这 类 方法 有 时 候 作 为 以 上 述 模型 的 子 类 ， 因 为 他 们 需要 依 
照 过 去 导致 独特 决策 的 一 些 偏好 结构 来 推测 一 个 指定 形式 (如 价值 函数 ， 或 者 级 别 
优先 关系 ) 的 偏好 模型 。 隐 含 偏好 模型 的 目的 是 在 于 使 产生 的 决策 过 程 中 与 以 往 决 
策 要 至 少 保持 一 致 L30] 。 

所 有 种 类 中 的 方法 都 可 以 为 推荐 系统 创建 全 局 偏好 模型 ， 这 依赖 于 选 定 的 决策 问题 类 
型 和 推荐 系统 预期 的 使 用 环境 。 


24.2.4 决策 支持 流程 


在 这 一 步 中 ， 一 个 给 定 的 MCDM 问题 的 最 终 决 策 是 通过 选择 一 个 合适 方法 来 做 
出 决策 ， 而 这 个 方法 又 源 于 之 前 的 每 一 步 所 定义 的 方法 之 中 。 与 传统 的 MCDM 问题 
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一 样 ， 多 准则 推荐 问题 在 不 同 的 领域 和 应 用 中 采用 不 同 的 方法 。 需 要 注意 的 是 ， 在 对 
多 准则 推荐 问题 建 模 时 ， 所 谓 的 MCDM 概念 很 宽泛 ， 并 没有 严格 的 界限 ， 这 是 因为 
许多 现 有 的 推荐 系统 都 可 以 归 人 MCDM 中 的 这 一 类 中 ， 由 于 它们 通常 考虑 多 源 信 息 
(如 用 户 概况 和 物品 属性 )， 事 实 上 就 将 它 变 成 了 实际 上 的 多 准则 决策 者 。 因 此 ， 在 本 
章 的 后 续 部 分 ， 我 们 关注 于 MCDM 推荐 系统 中 的 特殊 一 类 ， 它们 与 现 有 的 推荐 系统 


大 不 相同 。 


ER 24. 1 一 表 24.3 里 ， 我 们 基于 文献 [48] 所 述 ， 列 举 了 一 些 推荐 系统 ， 这 些 推荐 系 
统 可 以 大 致 归 类 为 MCDM[( 或 多 准则 推荐 ) 。 这 个 综述 所 涉及 的 推荐 系统 都 使 用 了 前 面 章 
节 里 提 到 过 的 MCDM 方法 之 一 ， 所 以 ， 通 过 对 现 有 的 MCDM 方法 的 了 解 ， 可 以 使 它们 
应 用 到 推荐 系统 中 辅助 决策 。 


选择 


分 类 


排序 


描述 


可 度量 


有 序 


概率 


表 24.1 已 有 多 准则 推荐 系统 支持 的 决策 问题 


Ariely et al. 2004 [6], Falle et al. 2004 [23], Kleinberg and Sandler 2003 [38], Lee et al. 2002 
[45], Lee 2004 [44], Price and Messinger 2005 [69], Tewari et al. 2003 [93] 


Cantador et al. 2006 [12], Choi and Cho 2004 [15], Emi et al. 2003 [22], Guan et al. 2002 [28], 
Kim and Yang 2004 [36], Liu and Shih 2005 [47], Masthoff 2003 [53], Montaner et al. 2002 [57], 
Nguyen and Haddawy 1999[60], Nguyen and Haddawy 1998 [59], Stolze and Rjaibi 2001 [90], 
Wang 2004 [99], Yu 2002 [100], Yu 2004 [101], Zimmerman et al. 2004 [103] 


Adomavicius and Kwon 2007 [2], Ardissono et al. 2003 [5], Balabanovic and Shoham 1997 [7], 
Ghosh et al. 1999 [27], Karacapilidis and Hatzieleftheriou 2005 [32], Kerschberg et al. 2001 [35], 
Kim et al. 2002 [37], Lakiotaki et al. 2008 [42], Lee and Tang 2007 [43], Lee et al. 2002 [45], Li 
et al. 2008 [46], Manouselis and Costopoulou 2007b [49], Manouselis and Costopoulou 2007c[ 50], 
Manouselis and Sampson 2004 [52], Mukherjee et al. 2001 [58], Noh 2004 [61], Perny and Zucker 
1999 [66], Perny and Zucker 2001 [67], Plantie et al. 2005 [68], Ricci and Werthner 2002 [73], 
Ricci and Nguyen 2007 [74], Sahoo et al. 2006 [79], Schafer 2005 [82], Schickel-Zuber and Faltings 
2005[83], Srikumar and Bhasker 2004 [89], Tang and McCalla 2009 [92], Tsai et al. 2006 [96] 


Aciar et al. 2007 [1], Cheetham 2003 [14], Denguir-Rekik et al. 2006 [19], Herrera-Viedma et 
al. 2004 [29], Schmitt et al. 2002 [84], Schmitt et al. 2003[85], Stolze and Stroebel 2003 [91] 


R242 已 有 多 准则 推荐 系统 采用 的 准则 类 型 


Adomavicius and Kwon 2007 [2], Ariely et al. 2004 [6], Balabanovic and Shoham 1997 [7], Can- 
tador et al. 2006 [12], Choi and Cho 2004 [15], Falle et al. 2004 [23], Ghosh et al. 1999 [27], 
Guan et al. 2002 [28], Kerschberg et al. 2001 [35], Kim and Yang 2004 [36], Kim et al. 2002 
[37], Lakiotaki et al. 2008 [42], Lee and Tang 2007 [43], Lee 2004 [44], Lee et al. 2002 [45], Li 
etal. 2008 [46], Liu and Shih 2005 [47], Manouselis and Costopoulou 2007b [49], Manouselis and 
Costopoulou 2007c [50], Manouselis and Sampson 2004 [52], Masthoff 2003 [53], Montaner et al. 
2002 [57], Mukherjee et al. 2001 [58], Noh 2004 [61], Plantie et al. 2005 [68], Ricci and Werth- 
ner 2002 [73], Ricci and Nguyen 2007 [74], Sahoo et al. 2006 [79], Schafer 2005 [82], Schickel-Zu- 
ber and Faltings 2005 [83], Schmitt et al. 2003 [85], Schmitt et al. 2002[84], Srikumar and Bhasker 
2004 [89], Stolze and Rjaibi 2001 [90], Tang and McCalla 2009 [92], Tewari et al. 2003 [93], Tsai 
et al. 2006 [96], Yu 2002[100], Yu 2004 [101], Zimmerman et al, 2004 [103] 


Aciar et al. 2007 [1], Cheetham 2003 [14], Emi et al. 2003 [22], Nguyen and Haddawy 1998 
[59], Nguyen and Haddawy 1999 [60] 


Herrera-Viedma et al. 2004 [29], Karacapilidis and Hatzieleftheriou 2005 [32], Perny and Zucker 
1999 [66], Perny and Zucker 2001 [67], Stolze and Stroebel 2003 [91], Wang 2004 [99] 


Ardissono et al. 2003 [5], Kleinberg and Sandler 2003 [38], Price and Messinger 2005 [69] 


第 24 章 多 准则 推荐 系统 515 


表 24.3 已 有 多 准则 推荐 系统 用 到 的 全 局 偏好 


价值 导向 模型 Aciar et al. 2007 [1], Adomavicius and Kwon 2007 [2], Ariely et al. 2004 [6], Balabanovic and 
Shoham 1997 [7], Cantador et al. 2006 [12], Choi and Cho 2004 [15], Denguir-Rekik et al. 2006 
[19], Falle et al. 2004 [23], Ghosh et al. 1999 [27], Guan et al. 200 [28], Herrera-Viedma et al. 
2004[29], Karacapilidis and Hatzieleftheriou 2005 [32], Kerschberg et al. 2001 [35], Kim and Yang 
2004 [36], Kim et al. 2002 [37], Kleinberg and Sandler 2003 [38], Lakiotaki et al. 2008 [42], Lee 
2004 [44], Lee et al. 2002 [45], Li et al. 2008 [46], Liu and Shih 2005 [47], Manouselis and Costo- 
poulou 2007b [49], Manouselis and Costopoulou 2007c [50], Manouselis and Sampson 2004 [52], 
Masthoff 2003[53], Montaner et al. 2002 [57], Mukherjee et al. 2001 [58], Noh 2004 [61], Perny 
and Zucker 1999 [66], Perny and Zucker 2001 [67], Plantie et al. 2005[68], Ricci andWerthner 2002 
[73]. Sahoo et al. 2006 [79], Schafer 2005 [82], Schickel-Zuber and Faltings 2005 [83], Schmitt et 
al. 2003 [85], Schmitt et al. 2002 [84], Srikumar and Bhasker 2004 [89], Stolze and Stroebel 2003 
[91]. Stolze and Rjaibi 2001 [90], Tang and McCalla 2009 [92], Tsai et al. 2006 [96], Yu 2004 
[101], Yu 2002 [100], Zimmerman et al. 2004 [103] 

优化 Lee and Tang 2007 [43], Price and Messinger 2005 [69], Tewari et al. 2003[93] 

级 别 优先 关系 Emi et al. 2003 [22]，Nguyen and Haddawy 1999 [60], Nguyen and Haddawy 1999 [59] 

其 他 偏好 模型 Ardissono et al. 2003 [5], Cheetham 2003 [14], Lee et al. 2002 [45], Ricci and Nguyen 2007 
[74]. Wang 2004 [99] 


多 准则 推荐 系统 的 分 类 依据 它们 支持 的 决策 问题 类 型 ( 见 表 24. 1) 、 使 用 的 准则 类 型 
( 见 表 24. 2) 以 及 全 局 偏好 建 模 方法 ( 见 表 24. 3) 。 基 于 表 24. 1， 有 意思 的 是 现 有 的 大 多 数 
研究 都 是 关于 物品 排序 的 决策 问题 (如 排序 候选 推荐 ) 。 也 有 一 些 系统 支持 依据 物品 对 用 户 
的 合适 度 将 物品 划分 到 不 同 的 类 别 ( 例 如 ， 推 荐 物品 与 非 推荐 物品 ) 。 尽 管 存在 一 些 应 用 可 
以 证 明 相 关 性 ， 只 有 很 少 的 几 个 系统 支持 选择 和 描述 问题 。 此 外 ， 如 表 24.2 所 示 ， 被 应 
用 的 准则 族 通常 是 可 度量 的 (measurable) ， 即 用 户 对 物品 每 个 准则 进行 评分 是 在 可 度量 范 
围 内 的 。 但 是 还 是 有 一 些 系统 使 用 模糊 、 有 序 和 概率 准则 来 表示 候选 推荐 物品 的 用 户 偏 
好 。 最 后 ， 表 24. 3 显示 ， 只 有 很 少 的 多 准则 推荐 涉及 全 局 偏好 模型 创建 ， 利 用 多 目标 优 
化 和 级 别 优先 关系 。 相 反 ， 大 多 数 使 用 了 价值 导向 模型 ， 通 常 以 额外 效用 函数 来 预测 。 也 
有 一 些 系统 没有 从 多 个 准则 集成 预测 ， 而 是 使 用 了 原始 向 量 模型 作为 结果 (例如 ， 通 过 从 
所 有 的 准则 提供 一 个 评分 向 量 )。 

非常 重要 的 一 点 是 现 有 的 系统 有 时 违反 了 Roy 方法 提出 的 一 致 性 规则 (例如 ， 没 有 使 
用 维度 的 完整 集 )。 此 外 ， 实 验 结果 显示 多 准则 系统 即使 在 没有 采用 形式 化 建 模 方法 的 时 
候 也 有 好 的 满意 度 。 这 意味 着 建 模 不 一 致 并 不 总 是 影响 问题 性 能 ， 尽 管 这 一 问题 还 有 待 进 
一 步 研究 。 


24.3 推荐 系统 的 MCDM 框架 : 经 验 教训 


根据 MCDM 框架 ， 在 表 24. 1 一 表 24. 3 归纳 的 推荐 系统 可 以 认为 是 多 准则 推荐 系统 ， 
非常 重要 的 一 点 就 是 要 理解 现 有 推荐 系统 的 类 型 在 这 一 框架 内 的 位 置 ， 以 及 MCDM 框架 
是 否 引 入 新 的 推荐 系统 类 型 。 

根据 推荐 方法 通常 可 以 把 推荐 技术 分 为 以 下 几 类 : 基于 内 容 、 协 同 过 滤 、 基 于 知识 和 
混合 推荐 [7]。 基 于 内 容 的 推荐 技术 是 根据 用 户 过 去 喜欢 的 物品 来 产生 用 户 的 最 佳 推荐 
[65]， 协 同 过 滤 推 荐 技术 是 基于 其 他 相似 偏好 用 户 的 信息 来 产生 推荐 [8]。 基 于 知识 的 方 
法 是 利用 用 户 和 物品 之 间 的 知识 来 发 现 满足 用 户 需求 的 物品 [9]。 基 于 知识 的 推荐 的 瓶颈 
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是 首先 要 得 到 知识 库 ， 通 过 获取 知识 库 来 避免 冷 启 动 和 数据 稀疏 问题 ， 而 这 些 问 题 是 基于 
内 容 和 协同 过 滤 仅 仅 依靠 用 户 的 评分 所 面临 的 。 混 合 方法 是 将 基于 内 容 、 协 同 过 滤 和 基于 
知识 多 种 推荐 方式 进行 融合 [10]。 对 24. 2 节 总 结 的 典型 的 MCDM 推荐 系统 进行 更 进一步 
的 分 析 ， 我 们 发 现 绝 大 多 数 推荐 系统 的 多 准则 特性 可 以 分 为 以 下 三 类 : 
。 多 属性 内 容 偏好 建 模 (multi-attribute content preference modeling) 。 尽 管 这 些 系统 
通常 采用 单 值 评分 (如 数值 评分 或 二 进 制 评分 )， 对 于 给 定 的 用 户 ， 这 些 系 统 企 图 
理解 和 对 用 户 过 去 喜欢 物品 的 多 准则 内 容 的 共性 建 模 ， 然 后 推荐 与 用 户 偏好 相 匹 
配 的 物品 。 例 如 ， 在 一 个 电影 推荐 系统 中 ， 用 户 偏好 电影 的 这 些 共 性 可 以 表示 为 
流派 、 演 员 、 导 演 等 用 户 对 电影 产生 共同 喜好 的 方面 。 

。 多 属性 内 容 搜索 与 过 滤 (mnulti-attribute content search and filtering)。 这 类 系统 允 

许 用 户 指定 基于 内 容 准则 的 偏好 ， 通 过 搜索 或 过 滤 ( 比 如 ， 只 搜索 “喜剧 ”电影 或 指 
定 “ 喜 剧 ” 电 影 比 “动作 ”电影 更 受 嘉 欢 )， 然 后 给 用 户 推荐 与 其 偏好 最 相似 的 物品 来 
满足 特定 搜索 或 过 滤 条 件 。 

。 基于 多 准则 评分 的 偏好 获取 (multi-criteria rating-based preference elicitation), i 

些 系统 允许 用 户 通过 多 准则 评分 指定 他 的 个 性 化 偏好 (如 给 电影 “Wanted” 的 故事 
情节 打 2 分 ， 而 影视 效果 打 5 分 )， 然 后 基于 该 用 户 和 其 他 用 户 多 准则 评分 向 用 户 
推荐 能 够 最 好 地 反映 用 户 的 个 性 化 偏好 的 物品 。 

多 属性 内 容 偏好 建 模 。 对 用 户 偏好 建 模 的 一 种 方法 是 分 析 用 户 购 买 过 或 喜欢 的 物品 的 
多 属性 内 容 。 很 多 多 准则 推荐 系统 将 基于 内 容 的 特征 直接 置 人 推荐 过 程 中 (如 使 用 基于 内 
容 的 方法 ) ， 或 者 是 与 协同 过 滤 推 荐 技术 融合 (如 使 用 混合 方法 ) 。 在 这 些 系 统 中 ， 用 户 通 
常 允许 通过 单 值 评分 来 隐 式 或 显 式 地 表达 他 们 的 偏好 。 利 用 这 些 评分 ， 通 过 分 析 用 户 购 买 
或 喜欢 的 物品 的 个 性 化 内 容 准 则 ， 推 荐 系统 可 以 自动 学 习 用 户 基于 内 容 的 偏好 。 例 如 ， 为 
每 个 用 户 标识 出 他 喜欢 的 内 容 属 性 (如 "喜剧 ”电影 )。 因 此 产生 的 推荐 结果 需要 考虑 这 些 偏 
好 的 内 容 属性 [7]。 大 量 传统 的 推荐 系统 采用 基于 内 容 、 基 于 知识 或 者 混合 推荐 方法 与 多 
属性 偏好 建 模 相 结 合 。 人 们 开发 了 一 些 打分 或 效用 函数 来 基于 用 户 偏 好 来 排序 备 选 物品 ， 
其 中 包括 基于 检索 或 基于 模型 的 技术 ， 如 贝 叶 斯 分 类 以 及 多 种 机 器 学 习 技 术 [4]。 关 于 这 
些 技术 的 详细 内 容 请 参阅 本 书 第 3 章 。 

多 属性 内 容 搜 索 与 过 滤 。 在 一 些 系统 中 ， 用 户 可 以 明确 地 指定 他 们 在 物品 多 个 属性 上 
的 通用 性 偏好 ， 搜 索 或 过 滤 技 术 可 以 利用 这 样 的 偏好 信息 来 找到 最 相关 的 物品 。 例 如 ， 在 
文献 [82] 中 ， 用 户 可 以 标识 电影 流派 、MPAA 评分 、 他 们 喜欢 的 电影 长 度 以 及 在 当前 时 
间 哪 个 属性 对 于 选择 电影 的 决策 是 最 重要 的 。 然 后 推荐 系统 通过 搜索 额外 的 显 性 偏好 来 缩 
小 可 选 范围 。 例 如 ， 一 个 用 户 表示 她 想 看 喜剧 电影 并 且 电影 流派 对 她 来 说 是 最 重要 的 属 
性 ， 那 么 只 有 喜剧 会 被 推荐 给 她 。 同 样 在 文献 L[45] 中 ， 用 户 可 以 为 推荐 系统 提供 不 同 内 容 
属性 的 偏好 和 对 应 的 不 同属 性 的 重要 性 权 值 。 

一 些 基 于 知识 的 推荐 系统 L35，37] 也 可 以 归 人 这 一 类 中 ， 因 为 用 户 可 以 通过 构建 
层次 分 类 树 来 提供 他 们 的 通用 偏好 (例如 ， 对 所 有 的 物品 特征 以 层次 化 方式 建 模 ) ， 并 
为 分 类 树 的 每 个 组 件 分 配 重要 程度 水 平 。 因 此 ， 推 荐 系统 根据 用 户 预 定义 的 多 属性 物 
品 分 类 系统 中 的 偏好 ， 向 用 户 推 荐 相关 度 最 高 的 物品 。 此 外 ， 部 分 基于 知识 的 混合 推 
荐 也 属于 这 一 类 ， 尤 其 是 基于 案例 推理 的 推荐 系统 ， 这 类 推荐 系统 的 物品 以 结构 化 的 
方式 表示 多 准则 内 容 ，( 例 如 ， 使 用 定义 良好 的 特征 集 或 特征 值 )[88]。 这 些 系统 允 
许 用 户 在 搜索 他 们 感 兴趣 的 物品 时 指定 他 们 在 物品 的 多 维 属 性 上 偏好 。 例 如 ， 几 个 基 
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于 案例 的 旅行 推荐 系统 [73，75]， 通 过 多 维 属性 内 容 上 的 偏好 (如 位 置 、 服 务 、 活 
动 ) 来 过 滤 不 想 要 的 物品 ， 并 基于 用 户 的 偏好 和 用 户 过 去 的 旅行 计划 或 者 类 似 用 户 的 
旅行 计划 对 可 能 的 旅行 计划 进行 排序 ， 从 而 找到 个 性 化 的 旅行 计划 。 此 外 ， 还 有 一 些 
基于 案例 的 推荐 系统 [9，70] 人 允许 用 户 评价 推荐 结果 ， 通 过 改进 他 们 的 需求 作为 交互 
与 迭代 的 推荐 过 程 的 一 部 分 ， 该 方法 使 用 不 同 的 搜索 和 过 滤 技 术 来 不 断 地 为 用 户 提供 
.改进 的 推荐 结果 。 例 如 ， 当 用 户 搜索 台式 电脑 时 ， 用 户 可 以 通过 对 当前 提供 的 推荐 结 
果 ( 电 脑 ) 的 个 别 特征 (如 价格 最 便宜 ) 或 多 个 特征 (如 处 理 速度 快 、 内 存 和 硬盘 容量 ) 
进行 评论 以 表达 改进 后 的 偏好 。 

基于 多 准则 评分 的 偏好 获取 。 这 类 推荐 系统 引入 了 多 准则 评分 ， 一般 通过 扩展 传统 协 
同 过 滤 方 法 ， 来 展示 用 户 对 单个 物品 各 个 部 分 的 主观 偏好 。 例 如 ， 这 类 推荐 系统 不 仅 允 许 
用 户 对 电影 的 整体 满意 度 评 分 ， 也 可 以 对 电影 的 不 同 因素 的 满意 度 进行 评分 ， 如 影视 效 
果 、 故 事情 节 或 表演 。 与 上 面 所 述 系 统 不 同 ， 不 需要 用 户 显 性 说 明 他 们 的 偏好 或 电影 视觉 
效果 组 件 的 重要 性 权 值 ， 而 是 指出 他 们 喜欢 某 部 电影 影视 效果 的 程度 。 这 类 系统 的 典型 代 
表 是 智能 旅行 推荐 系统 [73]， 该 系统 的 用 户 可 以 对 一 个 旅行 打包 中 的 多 个 物品 进行 评分 ， 
也 可 以 对 整个 旅游 打包 物品 评分 。 然 后 根据 用 户 评分 对 候选 旅行 计划 进行 排序 ， 系 统 通过 
推荐 的 旅行 计划 和 用 户 的 需求 进行 最 佳 匹配 。 这 类 系统 或 与 它 相 似 的 多 准则 评分 系统 将 是 
本 章 的 重点 ， 更 多 原型 系统 和 技术 将 在 后 续 章节 中 详 述 。 

总 之 ， 正 如 以 上 我 们 所 看 到 的 ， 许 多 使 用 了 传统 的 基于 内 容 、 基 于 知识 和 混合 技术 的 
推荐 系统 可 以 看 作 多 准则 推荐 系统 ， 因 为 它们 要 么 基于 用 户 历史 记录 ， 要 么 是 基于 用 户 指 
定 偏好 物品 的 多 属性 内 容 进 行 偏好 建 模 的 。 例 如 ， 物 品 多 属性 内 容 的 搜索 过 滤 条 件 ( 如 标 
识 偏 好 电影 的 流派 或 提供 多 个 预定 义 的 流派 的 偏好 值 )。 然 而 ， 如 前 面 所 述 ， 多 准则 推荐 
的 最 新 趋势 是 研究 在 协同 推荐 中 引入 多 准则 评分 的 新 颖 方法 。 我 们 相信 这 些 关 于 用 户 偏好 
的 额外 信息 为 提供 新 颖 的 推荐 结果 和 创建 一 个 独特 的 还 没有 被 广泛 研究 的 多 准则 评分 环境 
提供 了 很 多 机 会 。 因 此 ， 在 24. 4 节 中 ， 我 们 综述 了 这 类 将 单 评分 和 多 准则 一 起 使 用 的 系 
统 ， 也 就 是 我 们 所 说 的 多 准则 评分 推荐 系统 的 最 新 技术 。 


24.4 多 准则 评分 推荐 


本 节 中 ， 我 们 通过 对 与 之 相对 应 的 单 准 则 评分 形式 化 扩展 来 定义 多 准则 评分 推荐 问 
题 ， 并 进一步 探讨 额外 准则 在 推荐 系统 中 的 优势 。 


24.4.1 传统 的 单 值 评分 推荐 问题 


传统 的 推荐 系统 运行 在 用 户 和 物品 的 二 维 空间 。 物 品 对 用 户 的 效用 表示 为 有 序 集 R 

(如 一 定 范围 内 的 非 负 整数 或 实数 )， 推 荐 系统 的 目标 是 预测 某 个 物品 对 某 个 用 户 的 效用 。 
如 前 面 所 述 ， 一 个 效用 函数 R 可 以 形式 化 地 写 为 

R: UsersX Items—>R, (24. 2) 

效用 函数 由 用 户 的 输入 决定 ， 比 如 ， 用 户 对 物品 的 显 性 数值 评分 或 隐 含 用 户 偏 好 的 事务 

数据 (如 购买 历史 ) 。 大 多 数 的 传统 推荐 系统 使 用 单 准则 评分 来 表示 一 个 用 户 对 特定 物品 

的 整体 喜欢 程度 。( 如 一 个 用 户 对 物品 的 整体 效用 函数 )。 例 如 ， 在 如 表 24. 4 所 示 的 一 

个 电影 推荐 系统 中 ， 用 户 Alice 对 电影 Wanted 的 电影 评分 是 5( 总 分 是 10)， 可 以 表示 为 

R(Alice，Wanted) 一 5。 为 了 便于 呈现 ,我 们 假定 采用 基于 邻居 的 协同 过 滤 推 荐 技术 进 
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行 评分 预测 [71] ， 基 于 邻居 的 协同 过 滤 推 荐 技术 是 非常 流行 的 基于 启发 式 的 推荐 技术 中 
的 一 种 。 这 一 技术 是 基于 具有 相似 偏好 的 用 户 ( 邻 居 ) 的 评分 来 预测 用 户 对 给 定 的 物品 的 
评分 。 特 别 在 此 例 中 ， 推 荐 系统 试图 基于 观测 到 的 评分 来 预测 Alice 对 电影 Fargo 的 评 
分 。 由 于 Alice 和 John 在 以 前 看 过 并 且 评 分 过 的 四 部 电影 上 有 着 相似 的 评分 模式 ( 见 图 
24. 4)， 为 简单 起 见 ， 这 个 例子 中 我 们 使 用 John 对 电影 Fargo 的 评分 (如 9 分 ) 来 作为 用 
户 Alice 对 电影 Fargo 的 预测 评分 。 尽 管 在 实际 的 推荐 系统 中 ， 我 们 会 注意 到 用 户 通 常 
有 不 止 一 个 邻居 。 


表 24.4 单 值 评分 电影 推荐 系统 
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24.4.2 引入 多 准则 评分 来 扩展 传统 推荐 系统 


随 着 现实 世界 中 应 用 数量 的 增加 ， 在 扩展 推荐 系统 时 引入 多 准则 评分 被 认为 是 下 一 代 
推荐 系统 的 一 个 重要 问题 [4]。 多 准则 评分 系统 的 例子 ， 包 括 对 餐馆 的 评分 (如 食物 、 装 
修 、 服 务 ) 的 Zagat's guide， 提 供用 户 对 电子 产品 的 多 准则 推荐 (如 屏幕 大 小 、 性 能 、 电 池 
寿命 和 耗费 ) 的 Buy. com, DU Yahoo! 电影 采用 了 四 个 准则 (如 故事 、 动 作 、 编 导 和 视 
觉 ) 以 表示 用 户 的 评分 。 由 多 准则 评分 (而 不 是 单一 整体 评分 ) 提 供 的 额外 的 用 户 偏好 信息 
可 以 有 效 地 改善 推荐 系统 的 性 能 。 

一 些 多 准则 推荐 系统 在 对 某 个 用 户 对 一 个 指定 物品 的 效用 建 模 时 ， 既 采用 整体 评分 
R。， 也 采用 用 户 对 每 个 准则 c(c 二 1，…，k) 的 评分 Ri, ors Rus 然而 有 些 系 统 则 不 使 用 
整体 评分 ， 仅 仅 关注 于 每 个 准则 的 评分 。 因 此 ， 多 准则 推荐 问题 的 效用 公式 可 以 表示 为 包 
含 整 体 评分 或 不 包含 整体 评分 ， 如 下 所 示 : 

R: Users X Items—R, XR, X --- XR, (24. 3) 
或 
R; UsersXItems—R;, X --- XR, (24. 4) 
考虑 到 每 个 物品 的 多 准则 评分 可 用 性 (除了 传统 的 单 准则 整体 评分 )， 表 24.4 和 表 24.5 说 
明了 这 些 信息 对 于 推荐 系统 的 潜在 益处 。 当 Alice 和 John 在 单 评分 设置 中 具有 相似 的 偏好 
时 ( 见 表 24. 4)， 在 多 准则 评分 设置 中 ， 我 们 可 以 看 到 他 们 在 电影 的 几 个 方面 观点 完全 不 同 
( 见 表 24. 5) 。 进 一 步 检查 多 准则 评分 信息 ， 可 以 发 现 Alice 和 Mason 具有 相似 的 评分 模式 
CEE Alice 和 John 更 相似 ) 。 使 用 前 面 的 协同 过 滤 方 法 ， 考 虑 多 准则 评分 ， 基 于 Mason 对 
电影 Fargo 的 整体 评分 为 5， 预测 Alice 对 电影 Fargo 的 整体 评分 为 5。 

这 个 例子 暗示 了 单 准 则 整体 评分 可 能 隐藏 了 用 户 对 于 指定 物品 的 不 同 侧面 偏好 的 潜 
在 异 构 性 ， 并 且 多 准则 评分 可 以 帮助 用 户 更 好 地 理解 用 户 的 偏好 ， 因 此 可 以 为 用 户 产生 
更 准确 的 推荐 结果 。 同 时 也 说 明了 多 准则 评分 是 如 何 产 生 更 有 效 的 和 聚焦 的 推荐 结果 ， 
例如 ， 在 用 户 认为 故事 情节 很 重要 的 时 候 ， 可 以 推荐 在 故事 情节 上 具有 更 高 得 分 的 
电影 。 


第 24 章 多 准则 推荐 系统 519 


表 24.5 多 准则 电影 推荐 系统 (为 每 个 物品 评分 : 全 部 、 故 事 、 动 作 、 编 导 和 视觉 ) 
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因此 ， 推 荐 系统 需要 采用 多 准则 评分 的 新 推荐 算法 和 技术 。 部 分 系统 已 经 实现 了 这 些 
算法 ， 我 们 将 在 24. 5 节 中 进行 分 析 。 


24.5 多 准则 评分 推荐 算法 综述 


推荐 系统 通常 分 两 个 阶段 来 计算 和 产生 推荐 : 

。 FM (prediction): 这 一 阶段 计算 用 户 的 偏好 。 通 常 这 一 阶段 主要 是 根据 已 知 的 评 
分 或 者 是 其 他 信息 (如 用 户 概 况 或 物品 内 容 ) 来 估计 在 整个 或 部 分 的 User X Item 空 
间 的 效用 函数 RR。 换 句 话 说 ， 就 是 为 未 评分 物品 预测 评分 。 

。 推荐 (recommendation) : 这 个 阶段 主要 是 用 户 通过 一 些 推荐 流程 来 支持 用 户 决 
策 。 例 如 ， 这 个 阶段 可 以 向 用 户 推荐 最 大 效用 的 top-N 物品 (NN 个 最 高 评分 的 
物品 ) 。 

多 准则 评分 信息 在 这 两 个 阶段 中 以 不 同 的 方式 应 用 ， 已 经 开发 了 很 多 关于 预测 和 推荐 

的 方法 。 因 此 ， 我 们 可 以 将 现 有 的 多 准则 评分 推荐 技术 划分 为 两 组 ， 预 测 阶段 使 用 的 技术 
和 推荐 阶段 使 用 的 技术 。 下 面 将 分 别 进行 详细 阐述 。 


24.5.1 预测 中 使 用 多 准则 评分 


本 节 对 使 用 多 准则 评分 来 预测 整体 评分 或 单个 准则 评分 (或 两 者 ) 的 技术 进行 了 综述 。 
通常 ， 推 荐 技术 可 以 依据 效用 函数 的 形成 分 为 两 类 : 基于 启发 式 的 ， 有 时 也 称 为 基于 内 存 
的 和 基于 模型 的 [4]。 基 于 启发 式 的 技术 依据 用 户 观 测 到 的 值 或 依据 一 定 的 启发 式 假设 ， 
为 用 户 的 每 个 物品 在 线 计算 效用 。 例 如 ， 基 于 近邻 的 技术 假设 两 个 用 户 在 已 观察 的 物品 上 
有 相似 的 偏好 ， 那 么 他 们 在 未 观测 物品 上 也 具有 相似 偏好 。 相 对 来 讲 ， 基 于 模型 的 技术 一 
般 采用 统计 或 机 器 学 习 方法 来 学 习 一 个 预测 模型 。 可 以 更 好 地 解释 已 观测 的 数据 ， 然 后 使 
用 学 习 到 的 模型 来 估计 未 知 物品 的 效用 并 产生 推荐 结果 。 依 据 这 种 分 类 方式 ， 我 们 将 多 准 
则 评分 推荐 算法 也 划分 为 基于 启发 式 的 方法 和 基于 模型 的 方法 。 
24.5.1.1 启发 式 方法 

已 经 有 一 些 方法 被 提出 用 于 扩展 传统 基于 启发 式 协同 技术 的 相似 度 计算 来 反映 多 准则 
评分 信息 [2，49，92]。 在 这 些 方法 中 ， 用 户 之 间 的 相似 度 计 算是 通过 聚合 每 个 准则 上 的 
相似 度 或 使 用 多 维 距 离 度量 的 。 

特别 地 ， 在 基于 邻居 的 协同 推荐 中 ， 是 基于 具有 相似 偏好 或 品味 的 其 他 用 户 的 评分 来 
预测 指定 用 户 的 未 知 评分 。 因 此 ， 在 预测 的 第 一 步 就 是 选择 一 种 相似 度 计 算 方 法 以 便 为 每 
个 用 户 找到 他 们 的 邻居 集 。 在 单 准则 评分 推荐 系统 中 有 多 种 方法 用 来 计算 相似 度 。 最 流行 
的 方法 是 基于 相关 度 和 基于 余弦 的 方法 。 假 设 R(u， 让 表示 用 户 w 对 物品 i 的 评分 ，I(u， 
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u') 表 示 用 户 u WMAP u 的 共同 评分 物品 。 这 两 种 流行 的 相似 度 计 算 方法 可 以 形式 化 地 
写 为 
。 基于 Pearson 相关 系数 (pearson correlation-based) : 
>) Ru, —RGO) (RW i) — RD) 
sim(u,u') = ———iE. 45 
| 3j (Rai) —RGOY | $3. GG; — RW)? 
i€ I(u,u') i€ Muu’) 
。 基于 余弦 (cosine-based) : 


>) RGoDR(G',) 
sim(u 1!) = ——E Kaw) a (24. 6) 


多 准则 评分 推荐 系统 不 能 直接 使 用 上 面 的 公式 ， 因为 在 多 准则 评分 推荐 系统 中 R(u, 
让 包含 整体 评分 ro Mk 维 多 准 则 评分 ， e., res BB ROu, DG, no c ra) . B, 
每 一 对 (u， DRA R+1 个 评分 值 ， 而 不 是 一 个 单一 的 评分 。 有 两 种 不 同 的 方法 可 以 使 用 
十 1 个 评分 值 来 计算 相似 度 。 第 一 种 方法 是 聚合 传统 的 基于 单个 评分 的 相似 度 。 这 种 方法 
首先 采用 传统 的 相似 度 计算 ， 如 相关 性 或 余弦 值 ， 分 别 计算 用 户 在 每 个 准则 上 的 相似 度 ， 
然后 通过 聚合 & 十 1 个 相似 度 的 值 作为 用 户 最 后 的 相似 度 。Adomavicius 和 Kwon[2] 提 出 
两 种 聚合 方法 ， 平 均 相 似 度 和 最 坏 相似 度 ( 如 最 小 值 )， 如 式 (24. 7) 和 式 (24. 8) 所 示 。 作 为 
一 种 通用 方法 ，Tang 和 McCallaL92] 在 论文 推荐 系统 中 采用 加 权 和 方式 计算 每 篇 论文 的 单 
个 相似 度 。( 如 整体 评分 、 附 加 值 、 同 行 推荐 程度 、 学 习 者 的 兴趣 和 背景 知识 )。 如 
式 (24.9) 所 示 ， 在 他 们 的 方法 中 ，w. 表示 每 个 准则 的 权 值 ， 用 来 反映 该 准则 在 推荐 结果 
中 的 重要 性 和 有 用 性 。 

。 平均 相似 度 (average similarity) ; 


sim,,,(u,u') = pty sim en (24. 7) 
* 最 坏 ( 最 小 值 ) 相 似 度 (worst-case(smallest) similarity) : 
sims, lu, u')-— min sim, (u, u') (24. 8) 


。 RAW (aggregate similarity) : 


k 
SiMgggregate (UU) = > w.sim,(u,u') (24. 9) 


第 二 种 计算 相似 度 的 方法 是 多 维 距 离 度量 ， 如 Manhattan, Euclidean 和 Chebyshev 
距离 度量 [2]。 两 个 用 户 u 和 ww' 在 物品 i 上 的 距离 4(R(u, i), Ru, i)) 可 以 通过 下 面 公 
RHA: 

* Manhattan 距离 : 





R.(u' ,i) | (24. 10) 


c=0 


* Euclidean BBR: 


k 
* Chebyshev 或 最 大 值 距离， 
max |R.(u, i) —R. Cu , i)| (24. 12) 





R.(u',i) |? (24. 11) 
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两 个 用 户 之 间 的 总 体 距 离 可 以 简单 通过 计算 两 个 用 户 共同 评分 物品 的 平均 距离 得 到 ， 
可 以 形式 化 地 写 为 


dittun i = or r Y dR Ru a (24. 13) 


| T(usu Yeeros 
AT AP BA WOHWDER RAD, ZAMIR). h FENE e 
系 ， 所 以 需要 对 两 个 度量 进行 一 个 简单 的 转换 ， 如 下 所 示 : 


s 1 
sim(u, u )= 





1 
lt+dist(u, u ) (24. 14) 


Manouselis 和 Xostopoulou[49] 也 提出 了 三 种 不 同 的 方法 来 计算 多 准则 设置 中 用 户 之 
间 的 相似 度 : 按 优 先 级 相似 度 (similarity-per-priority) 、 按 评价 相似 度 (similarity-per-eval- 
uation) 和 按 部 分 效用 相似 度 (similarity-per-partial-utility) 。 按 优先 级 相似 度 算 法 基于 用 户 
u 对 每 个 准则 c 的 重要 性 权 值 w. (wu) (而 不 是 评分 尺 (x，i)) 来 计算 用 户 之 间 相 似 度 。 在 这 
种 方式 中 ， 通 过 创建 一 个 与 目标 用 户 具 有 表现 相同 的 偏好 性 邻居 用 户 集 ， 然 后 基于 用 户 的 
邻居 用 户 的 整体 效能 来 预测 用 户 对 物品 的 整体 效能 。 此 外 ， 按 评价 相似 度 和 按 部 分 效用 相 
似 度 算 法 为 目标 用 户 在 每 个 准则 上 分 别 创 建 邻 居 用 户 ， 然 后 预测 每 个 用 户 的 准则 评分 。 按 
部 分 效用 相似 度 算法 则 是 基于 用 户 对 每 个 准则 的 加 权 评 分 来 计算 相似 度 。 

在 这 些 系统 中 ， 用 户 之 间 的 相似 度 是 采用 多 准则 评分 获取 ， 剩 余 的 推荐 流程 和 单 准 则 
推荐 系统 的 推荐 流程 是 一 样 的 。 下 一 步 就 是 为 指定 用 户 找到 一 个 最 相似 度 的 邻居 集 ， 然 后 
基于 邻居 的 评分 来 预测 用 户 对 未 知 物品 的 评分 。 因 此 ， 基 于 相似 度 的 方法 仅仅 适用 于 需要 
计算 用 户 ( 或 物品 ) 相 似 度 的 基于 邻居 的 协同 过 滤 推 荐 技术 。 

总 之 ， 多 准则 评分 可 以 通过 以 下 两 种 方式 来 计算 两 个 用 户 之 间 的 相似 度 [2]: DRA 
每 个 准则 的 单 准则 相似 度 的 值 ; 2) 计 算 多 准则 评分 在 多 维 空间 中 的 距离 。 在 小 规模 的 Ya- 
hoo! 电影 数据 集 的 实验 结果 显示 ， 这 两 种 启发 式 方法 都 优 于 传统 的 单 值 评分 协同 过 滤 技 
术 ( 即 只 用 单 值 整体 评分 )， 在 top- 的 推荐 精度 方面 提升 了 3.826, 代表 了 系统 为 每 个 用 
户 预 测 的 N 个 最 相关 物品 中 整体 评分 真正 高 的 百分比 L2]。 精 度 的 提升 依赖 于 协同 过 滤 技 
术 中 的 多 个 参数 ， 如 邻居 规模 ，top-N 推荐 的 数量 。 此 外 ，Manouselis 和 Costopoulou 
[49] 建 议 这 些 方法 可 以 进一步 扩展 ， 不 仅 可 以 通过 已 知 评分 信息 来 计算 相似 度 ， 还 可 以 利 
用 每 个 准则 的 权 值 来 计算 相似 度 。 第 二 种 方法 用 于 电子 市 场 推荐 在 线 应 用 ， 购 买 者 和 销售 
者 可 以 基于 用 户 对 多 个 电子 市 场 的 多 准则 评估 ， 获 得 和 交换 关于 价格 以 及 待 售 商品 的 信 
息 。 与 数值 平均 和 随机 这 类 非 个 性 化 的 算法 相 比 ， 使 用 欧 氏 距离 来 度量 相似 度 的 按 优先 级 
相似 度 算法 的 性 能 最 好 ， 平 均 绝对 误差 (MAE) 在 1—7 的 范围 内 达到 0. 235， 覆 盖 率 (可 以 
推荐 给 用 户 的 产品 范围 ) 达 到 93% ， 数 值 平均 和 随机 的 MAE 分 别 为 0.718 和 2.063， 和 覆盖 
率 则 都 达到 100%[49]。 

24. 5. 1.2 基于 模型 的 方法 

基于 模型 的 方法 是 通过 对 已 观测 到 的 数据 进行 学 习 ， 构 建 了 一 个 预测 模型 来 估计 未 知 
评分 的 。 现 有 的 几 种 多 准则 推荐 系统 可 以 划 人 此 类 ， 包 括 聚 合 函 数 、 概 率 模型 以 及 多 维 线 
性 矩阵 分 解 (MSVD) 。 

聚合 函数 方法 。 在 基于 相似 度 的 启发 式 方法 中 ， 整 体 评分 m 通常 被 简单 地 作为 一 个 
单独 的 准则 评分 ; 然而 在 聚合 函数 方法 中 ， 将 整体 评分 作为 多 准则 评分 的 一 种 聚合 [2j。 
根据 这 一 假设 ， 这 一 方法 需要 找到 一 个 聚合 函数 S 来 表示 整体 评分 与 多 准则 评分 之 间 的 关 
A,» Bp 
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ro =fCris c.n) (24. 15) 
例如 ， 在 一 个 电影 推荐 应 用 中 ， 故 事情 节 准 则 的 评分 有 非常 高 优先 权 ， 也 就 是 说 ， 故 
事情 节 评 分 高 的 电影 受到 某 些 用 户 的 喜爱 ， 不 管 其 他 准则 评分 如 何 。 因 此 ， 如 果 某 部 电影 
的 故事 情节 评分 预测 值 高 ， 为 了 更 精确 推荐 ， 该 电影 的 整体 评分 也 应 该 高 。 
聚合 函数 方法 由 三 步 组 成 ， 如 图 24. 1 所 示 ， 首 先 ， 这 一 方法 可 以 采用 任意 的 推荐 技 
术 来 估计 & 个 单独 评分 ， 也 就 是 & 维 多 准 则 评分 问题 被 分 解 为 & 个 单 准则 评分 推荐 问题 。 
其 次 ， 通 过 领域 专家 、 统 计 技 术 或 机 器 学 习 技 术 来 选择 聚合 函数 f。 例 如 ， 领 域 专 家 可 基 
于 以 前 的 经 验 和 知识 建议 对 每 个 物品 的 多 准则 评分 进行 简单 的 平均 ， 也 可 以 通过 统计 技术 
来 获取 聚合 函数 ， 如 线性 和 非 线 性 回归 技术 ; 还 可 以 使 用 复杂 的 机 器 学 习 技术 ， 如 人 工 神 
经 网 络 。 最 后 ， 未 评分 物品 的 整体 评分 是 基于 个 单独 评分 和 所 选 定 的 聚合 函数 f 来 计 
算 的 。 


Userld, Itemid, Overall, C1, C2, C3 





—— a Criterion 2 
MM Criterion 3 
采用 任意 推荐 312132 
技术 单独 预测 d 
未 知 评分 
| Users Overall 
É 
- 采用 统计 或 机 器 学 Sji. 

习 技 术 学 习 聚 合 函 在 单个 准则 中 采用 f 

数 f， 得 到 整体 评 和 预测 也 的 评分 预 

分 =f(C1,C2,C3) 测 未 知 整体 评分 
—— 





图 24.1 聚合 函数 方法 (三 准则 评分 系统 的 实例 ) 


尽管 前 面 所 述 的 基于 相似 度 的 启发 式 方法 仅 应 用 到 基于 邻居 的 协同 过 滤 技 术 ， 通 过 聚 
合 函 数 可 以 将 任意 一 种 传统 的 推荐 技术 进行 融合 ， 因 为 在 预测 的 第 一 步 中 使 用 的 是 单 准则 
评分 。 作 为 可 能 的 聚合 函数 例子 ，Adomavicius 和 Kwon[2] 基 于 已 知 评分 使 用 线性 回归 和 
估 值 系数 (如 每 个 准则 的 权重 ) 。 

Adomavicius 和 Kwon[2j] 还 指出 ， 聚 合 函 数 有 不 同 的 范围 ， 基 于 整体 的 (如 基于 整个 
数据 集 学 习 的 单 聚合 函数 ) 、 基 于 用 户 的 或 基于 物品 的 (如 根据 每 一 个 用 户 或 物品 学 习 一 个 
单独 的 聚合 函数 ) 。 

Yahoo! 电影 数据 的 实验 分 析 显 示 ， 利 用 聚合 函数 方法 (使 用 多 准则 评分 信息 ) 表 现 优 
于 传统 的 单 值 评分 协同 过 滤 技 术 ( 只 使 用 单一 的 整体 评分 )， 在 top-N(N=3, 5, BH 
准确 度 提升 0.3% 一 6.3%%[2]。 

概率 模型 方法 。 一 些 多 准则 推荐 方法 采用 了 数据 挖掘 和 机 器 学 习 中 越 来 越 流行 的 概率 
建 模 方法 。 其 中 一 个 例子 就 是 Sahoo 等 的 工作 [79]， 它 扩展 了 Si 和 Jin[86] 的 FMM( 易 变 
混合 模型 ，Flexible Mixture Model) 。 如 图 24. 2a R, FMM 假定 有 两 个 隐 含 变量 Z, 和 
Zi( 为 用 户 和 物品 )， 它 们 被 用 于 确定 用 户 u 对 物品 i 单 值 评分 。 如 图 24. 2b 所 示 ，Sahoo 
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等 [79] 利 用 Chow-Liu 树 结构 发 现 L16j]， 还 揭示 了 整体 评分 R SAME (ns re r3, 
rs) 之 间 的 依赖 结构 ， 并 将 这 种 依赖 结构 融入 FMM 。 


o Q 


© © © 
a) 单 值 评分 推荐 系统 的 易 变 混合 模型 b) 有 着 多 准则 评分 依赖 结构 的 FMM 
图 24. 2 推荐 系统 中 概率 模型 方法 的 实例 
FMM 方法 是 基于 以 下 假设 ， 即 三 个 变量 (用 户 w、 物 品 i 和 评分 r) 的 联合 概率 可 以 表 
示 为 两 个 隐 含 变量 Z, MZ 的 所 有 可 能 的 组 合 的 概率 和 ， 如 下 所 示 : 
Plasisr) = SyP(Z)P(Z)P(u|Z) POG|Z) P(r|2, ,2.) (24. 16) 
ZZ 





总 之 ， 目 标 用 户 的 未 知 物品 的 整体 评分 可 以 通过 以 下 两 步 得 到 : 学 习 和 预测 。 第 一 步 
(43), FMM 的 所 有 参数 都 是 通过 期 望 最 大 化 算法 (EM) 来 估计 得 到 的 ; 在 第 二 步 ( 预 
测 ) 中 ， 使 用 估计 的 参数 ， 把 最 有 可 能 的 值 (如 最 大 概率 的 评分 值 ) 作 为 未 知 物品 的 整体 预 
测评 分 ， 这 种 方法 已 经 扩展 到 多 准则 评分 ， 具 体 的 算法 可 以 在 文献 L[79] 找 到 。 

Sahoo 等 [79] 将 他 们 在 图 24. 2b 中 的 模型 与 假设 的 隐 含 变量 条 件 独立 的 评分 模型 进行 
比较 ， 并 发 现 有 依赖 结构 的 模型 比 独立 假设 的 模型 效果 要 好 。 这 一 发 现 揭 示 了 在 多 准则 评 
分 中 存在 晕 轮 效应 (halo effect) 。 晕 轮 效应 是 心理 学 中 经 常 研究 的 一 种 现象 ， 即 对 属于 某 
一 类 的 物体 的 认 知 偏见 会 影响 对 其 他 类 的 认 知 [94]。 在 多 准则 推荐 系统 中 ， 用 户 的 单 准 则 
评分 之 间 因 为 晕 轮 效应 会 产生 相互 关联 ， 而 每 个 单 准则 评分 和 整体 评分 的 关联 程度 比 对 单 
个 准则 之 间 的 影响 程度 更 大 [79]。 换 句 话 说， 用 户 对 特定 物品 的 整体 评分 会 影响 其 对 单个 
准则 的 评分 。 因 此 ， 控 制 整 体 评分 并 减 小 它 的 早 轮 效应 ， 并 且 每 个 评分 能 够 互相 独立 ， 如 
图 24. 2b 的 Chow-Liu 树 形 依赖 结构 所 示 o 

使 用 Yahoo! 电影 数据 集 ，Sahoo 等 [79] 认 为 ， 多 准则 评分 信息 在 可 用 的 训练 数据 非 
常 少时 ，( 如 用 于 训练 的 数据 不 到 整个 数据 集 的 15%) 是 具有 优势 的 。 另 一 个 方面 ， 当 有 大 
量 的 训练 数据 可 用 时 ， 额 外 的 评分 信息 没 带 来 更 多 提升 。 在 这 一 分 析 中 ， 他 们 采用 MAE 
来 度量 推荐 结果 的 准确 度 。 然 而 ， 当 他 们 在 检索 TopN 物品 中 使 用 准确 率 和 召回 率 来 验证 
概率 模型 方法 ， 他 们 的 模型 在 所 有 例子 中 都 有 较 好 的 表现 (包括 大 数据 集 和 小 数据 集 )， 最 
大 提升 了 10%。 随 着 更 多 的 训练 数据 ， 多 准则 评分 和 单 准则 评分 在 准确 率 和 召回 率 方面 的 
差异 在 逐渐 缩小 。 

多 维 线性 矩阵 分 解 方法 (MSVD) 。Li 等 [46] 提 出 了 一 种 利用 MSVD 技术 来 改善 传统 协 
同 过 滤 的 算法 。 奇 异 值 分 解 (Singular Value Decomposition，SVD) 技 术 在 线性 代数 中 得 到 . 
广泛 研究 ， 由 于 它 可 以 有 效 地 提升 推荐 结果 的 准确 度 ， 使 得 它 在 推荐 系统 中 的 使 用 也 越 来 
越 广泛 [26，41，81]。 在 单 值 评分 推荐 系统 中 ， 这 类 技术 发 现 了 物品 的 隐 含 特征 ， 包 括 明 
确定 义 的 物品 维度 和 无 法 解释 的 维度 。 特 别 地 ， 是 使 用 & 个 隐 含 特征 (如 Rank-K SVD), 
用 户 u 与 用 户 因 子 向 量 p,( 用 户 对 特征 & 的 偏好 )， 物 品 i 与 物品 因子 向 量 g;( 物 品 在 特征 
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上 的 权重 ) 相 关联 。 在 用 户 和 物品 因子 向 量 中 的 所 有 值 都 被 估计 后 ， 用 户 对 物品 i 的 偏 
好 程度 可 以 表示 为 R" (uw，i)， 可 以 通过 两 个 向 量 的 内 积 得 到 ， 即 
R' (Cu, i) — Piqi (24. 17) 

SVD 技术 被 经 常用 于 二 维 数据 的 分 解 ， 而 MSVD 技术 [17j 可 以 用 于 多 维 数据 的 分 解 ， 
如 多 准则 评分 。 尤 其 是 Li 等 在 [46] 中 使 用 MSVD 降低 多 准则 评分 数据 的 维度 ， 并 在 餐馆 
推荐 系统 的 情境 下 评估 了 它们 的 方法 ， 在 餐馆 推荐 系统 中 用 户 可 以 在 十 个 准则 (如 菜品 、 
环境 、 服 务 等 ) 对 一 个 餐馆 进行 评分 。 更 确切 地 说 ， 他 们 使 用 MSVD 技术 来 发 气 用 户 、 物 
品 和 准则 三 者 之 间 的 关系 ， 并 使 用 这 些 数据 来 发 掘 每 个 用 户 的 邻居 以 及 计算 topN 推荐 。 
结果 显示 ， 与 传统 的 单 值 模型 相 比 ， 他 们 的 方法 在 推荐 结果 的 准确 度 上 (topNN 准确 度 方式 
进行 度量 ) 提 升 了 5%。 

总 之 ， 上 面 的 方法 采用 一 些 复杂 的 学 习 技 术 来 处 理 多 准则 推荐 做 了 一 些 尝试 。 我 们 希 
望 在 将 来 能 看 到 更 多 类 似 的 技术 。 

在 24.5.2 节 中 ， 我 们 探讨 向 用 户 推荐 物品 的 不 同方 法 ， 我 们 假设 未 知 的 多 准则 评分 
采用 上 述 任意 一 种 方法 已 经 被 估算 出 来 。 


24.5.2 推荐 中 使 用 多 准则 评分 


如 前 所 述 ， 多 准则 推荐 系统 可 能 选择 建 模 一 个 用 户 对 一 个 物品 的 效能 ， 可 以 同时 包括 
整体 评分 和 单个 物品 准则 评分 ， 也 可 以 只 包括 单个 准则 评分 。 如 果 整 体 评分 作为 模型 的 一 
部 分 ， 推 荐 流程 就 非常 直接 ， 推 荐 系统 使 用 整体 评分 来 向 用 户 推荐 最 高 预测 值 的 物品 。 换 
名 话说， 推荐 流程 与 传统 的 单 准则 推荐 系统 基本 上 相同 。 

然而 ， 没 有 整体 评分 时 ， 推 荐 流程 就 会 更 复杂 ， 因 为 如 何 建 立 物 品 的 整体 序列 不 那么 
明显 。 例 如 ， 假 定 有 个 双 准 则 电影 推荐 系统 ， 用 户 依据 电影 的 故事 情节 和 影视 效果 来 判 
断 。 在 以 下 两 个 物品 中 选择 一 个 电影 来 推荐 : 1) 电 影 X， 预 测 的 故事 情节 为 8， 影视 效果 
为 2; 2) 电影 Y， 预 测 的 故事 情节 为 5， 影 视 效 果 为 5。 由 于 没有 整体 评分 来 对 电影 排序 ， 
除非 采用 其 他 的 建 模 方法 ， 用 非 数 值 方式 (如 基于 规则 的 ) 来 表示 用 户 偏好 ， 和 否则 很 难 判断 
哪 部 电影 更 好 。 在 推荐 系统 文献 中 ， 提 出 了 几 种 方法 来 应 对 这 个 问题 ， 有 些 试图 为 每 个 用 
户 设 计 一 个 物品 序列 和 一 个 单 值 全 局 优化 方案 ， 另 一 部 分 则 采用 部 分 物品 序列 找到 多 个 解 
〈 帕 雷 托 最 优 ) 。 下 面 我 们 简单 介绍 与 多 准则 优化 的 相关 工作 ， 描 述 一 些 已 经 用 于 推荐 系统 
的 方法 ， 以 及 探讨 在 多 准则 评分 的 推荐 阶段 中 的 其 他 潜在 应 用 方法 。 

24. 5. 2. 1 相关 工作 : 多 准则 优化 


多 准则 优化 问题 在 操作 研究 中 广泛 应 用 [21]， 而 不 是 在 推荐 系统 的 背景 下 。 多 准则 优 
化 问题 帮助 决策 者 在 多 个 准则 冲突 或 互相 竞争 的 情况 下 选择 最 佳 选 项 。 例如， 从 多 个 视 
角 ， 如 人 金融、 人力 资源 相关 以 及 环境 方面 都 可 以 纳入 组 织 决策 中 。 如 文献 [4 讨论 ， 以 下 
方法 主要 用 于 处 理 多 准则 优化 问题 ， 也 可 以 应 用 到 推荐 系统 : 

。 找到 帕 雷 托 最 优 解 ; 

。 通过 多 准则 线性 融合 ， 将 多 准则 优化 问题 简化 为 单 准 则 推荐 优化 问题 ; 

。 优化 最 重要 的 准则 ， 把 其 他 准则 作为 约束 ; 

。 连续 地 每 次 优化 一 个 准则 ， 转 换 为 最 优 解 来 约束 ， 或 在 其 他 准则 上 重复 这 一 流程 。 

下 面 将 描述 在 推荐 系统 中 应 用 的 几 种 推荐 方法 ， 所 有 这 些 方法 都 源 于 多 准则 优化 技术 。 
24.5.2.2 设计 物品 推荐 整体 序列 


在 推荐 系统 的 文献 中 ， 部 分 采用 决策 科学 中 多 属性 效用 理论 ， 这 个 可 以 被 作为 一 种 多 
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准则 的 线性 组 合并 找到 最 优 解 [42] 。 

例如 ，Lakiotaki 等 [42] 提 出 的 方法 采用 了 文献 [87] 提 出 UTA 方法 对 物品 进行 排序 。 
他 们 的 算法 的 目标 是 通过 加 入 每 个 准则 c(c 王 1，…，A) 边 界 效用 来 为 每 个 用 户 估计 特定 物 
品 的 整体 效用 。 


| 
U= S ulge) (24. 18) 


EP, g. 是 对 准则 c 的 评分 ，w (8g-) 是 特定 用 户 的 非 增 的 实数 函数 (边界 效用 函数 ) 。 
由 于 这 一 模型 使 用 有 序 回 归 模 型 技术 进行 排序 ，Kendall' tau 被 用 于 度量 两 个 定 序 水 平 
变量 的 相关 性 来 比较 实际 顺序 和 预测 顺序 。 使 用 Yahoo! 数据 集 的 实验 结果 显示 ， 
20. 4% HY) FA 18$ Bl Kendall's tau 为 1， 即 推荐 系统 的 预测 序列 与 用 户 声明 序列 的 一 致 。 
所 有 用 户 的 Kendall's tau 是 0.74。 他 们 的 模型 也 使 用 了 接受 者 操作 曲线 (Receiver Oper- 
ating Curve，ROC) 进 行 评 估 ，ROC 是 用 于 描述 真正 (ture positive) 与 假 正 (false positive) 
之 间 的 相对 权衡 。 得 到 的 曲线 下 区 域 (Area Under Curve，AUC) 是 0.81， 其 中 1 表示 完美 
分 类 器 ，0. 5 表示 随机 分 类 器 的 性 能 ， 结 果 显 示 多 准则 推荐 系统 在 用 户 偏 好 建 模 方面 有 显 
著 的 改进 。 

相 类 似 ，Manourselis 和 Costopoulou[49] 中 提出 一 种 方法 ， 整 体 效 用 U 要 么 是 将 & 个 
预测 部 分 效用 求 和 ， 要 么 是 根据 用 户 对 每 个 准则 c MAW. 对 预测 评分 进行 加 权 求 和 。 
这 两 种 情况 中 ， 候 选 物 品 的 整体 效用 可 用 以 下 聚合 函数 来 计算 : 


k 


U= Su = wr. (24. 19) 

最 后 ， 利 用 如 上 所 述 的 任意 技术 建立 起 候选 物品 的 整体 序列 ， 每 个 用 户 都 得 到 最 大 效 
用 的 推荐 物品 。 
24.5.2.3 发 现 帕 雷 托 最 优 物品 推荐 

当 多 个 物品 相关 联 的 多 个 准则 冲突 和 物品 整体 序列 不 是 可 以 直接 获取 时 ， 这 一 方法 可 
以 从 大 量 的 备 选 物品 中 找到 几 个 好 的 物品 。 数 据 包 络 分 析 (Data Envelopment Analysis, 
DEA)， 通 常 也 被 称 为 边界 分 析 ， 在 操作 研究 中 广泛 用 于 度量 决策 单元 的 产 出 效果 (Deci- 
sion Making Units, DMU)[13]. DEA 计算 用 来 发 现 哪些 物品 是 “最 佳 ” 的 效率 边界 。 
DEA 不 需要 为 每 个 准则 定制 先 验 权 值 ， 它 利用 线性 规划 为 每 个 DMU 得 到 最 佳 权 值 集合 。 
尤其 在 多 准则 推荐 系统 中 ， 假 定 所 有 的 备 选 物品 都 可 以 
推荐 给 用 户 ( 包 括 所 有 准则 的 预测 评分 )，DEA 能 够 决定 
包括 在 所 有 准则 上 有 最 好 评分 的 候选 物品 并 作为 缩减 后 
的 物品 集 ， 这 些 物 品 可 以 推荐 给 用 户 。 

RE DEA 没有 被 直接 应 用 到 多 准则 评分 推荐 中 ， 
但 是 非常 相似 的 是 ， 缺 少 整体 评价 的 多 准则 推荐 问题 也 
可 以 表述 成 一 个 在 数据 库 领 域 的 数据 查询 问题 L43]。 
Lee 和 Teng[43] 使 用 Skyline 查询 ， 利 用 多 准则 (如 食 





物 、 装 饰 、 服 务 和 消费 )， 来 寻找 最 好 的 餐馆 。 如 TN 
图 24.3 Pitas, Skyline 查询 标识 了 一 些 skyline 点 ( 即 图 24.3 二 维 空间 中 skyline 点 (最 
帕 雷 托 最 优点 ) ， 这 些 点 并 不 依赖 于 其 他 的 备 选 餐馆 的 二 佳 候选 餐馆 ) 的 实例 


维 数据 空间 (食物 和 装饰 )。 对 于 一 个 给 定 用 户 ， 如 果 存 
在 另外 一 个 备 选 物品 在 所 有 准则 上 的 评分 都 优 于 它 ， 这 个 候选 物品 就 被 认为 是 最 适合 推 
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荐 的 。 

Zagat Suvery 在 [43] 使 用 多 准则 评分 的 实验 结果 显示 ， 使 用 Skyline 查询 的 推荐 系统 
可 以 减少 选择 的 数量 。 例 如 ， 当 一 个 用 户 搜索 位 于 纽约 的 自助 餐 餐 馆 ， 且 价格 低 于 30 美 
元 ， 基 于 四 个 准则 ， 系 统 在 12 个 备 选 餐 厅 中 系统 推荐 了 2 个 。 然 而 ， 这 一 基础 工作 需要 
在 多 个 方向 进一步 扩展 ， 随 着 准则 个 数 的 增加 Skyline 查询 不 能 很 好 地 扩展 ， 因 为 在 大 量 
的 Skyline 点 情况 时 导致 很 高 的 计算 代价 。 
24.5.2.4 使 用 多 准则 评分 作为 推荐 过 滤器 

与 在 推荐 系统 中 使 用 内 容 属性 来 对 推荐 结果 过 滤 [45，82] 类 似 ， 多 准则 评分 也 可 以 被 
用 于 对 推荐 结果 进行 过 滤 。 例 如 ， 一 个 用 户 在 某 一 特定 时 间 指 定 只 有 故事 情节 很 好 的 电影 
才能 推荐 给 她 ， 而 不 管 其 他 准则 ， 那 么 在 推荐 时 只 有 故事 情节 上 预测 评分 (之 9， 满 分 10 
分 ) 的 电影 才 推荐 给 该 用 户 。 这 一 方法 和 内 容 推 荐 L45，82]， 以 及 情境 感知 [3] 中 推荐 方法 
对 推荐 内 容 的 过 滤 方 式 相似 ; 然而 ， 又 与 它们 有 一 些 细 微 不 同 ， 因 为 它 的 过 滤 方式 不 是 依 
据 客观 的 内 容 属 性 (如 电影 时 间 二 120 分 钟 ) 或 额外 情境 信息 维度 (如 Timeof Week = Week- 
end), ， 而 是 基于 主观 的 评分 准则 (如 故事 情节 之 9) 来 过 滤 的 ， 其 预测 结果 主要 依赖 于 用 户 
的 口味 和 偏好 。 


24.6 讨论 及 未 来 工作 


推荐 系统 是 一 个 充满 生机 与 不 断 变化 的 研究 领域 。 在 最 近 一 些 重要 的 研究 中 ， 推 荐 系 
统 开始 采用 用 户 提 供 的 多 准则 评分 。 本 章 研 究 了 多 准则 推荐 系统 的 算法 和 技术 。 这 些 新 系 
统 还 没有 被 广泛 研究 ， 本 节 对 这 类 推荐 系统 的 一 系列 挑战 和 研究 方向 进行 阐述 。 

应 对 干预 。 多 准则 评分 提供 的 额外 信息 可 能 导致 一 个 非常 重要 的 问题 就 是 干预 。 为 了 
使 推荐 系统 取得 好 的 推荐 性 能 ， 通 常 需 要 用 户 提供 一 定数 量 的 偏好 反馈 (如 物品 评分 )。 这 
一 问题 在 单 评分 推荐 系统 中 同样 存在 ,一 些 在 用 户 偏好 反馈 获取 中 降低 干预 性 的 方法 被 提 
出 [40，56，62]。 由 于 用 户 需 要 对 物品 的 多 个 属性 进行 评分 ， 所 以 多 准则 评分 系统 需要 更 
高 层次 的 用 户 参 与 。 因 此 ， 采 用 度量 多 属性 评分 的 代价 和 收益 变 得 异常 重要 ， 需 要 在 用 户 
需求 和 系统 设计 需求 之 间 找 到 一 个 最 佳 解决 方案 。 基 于 以 前 一 系列 的 决策 可 以 采用 偏好 分 
解 方法 来 形成 隐 含 的 偏好 模型 。 一 个 典型 的 例子 就 是 UTA( 即 效用 递增 ，Uftility Addi- 
tive) 方 法 ， 可 以 根据 已 知 评分 来 抽取 效用 函数 [42]。 另 外 一 个 例子 就 是 根据 用 户 在 多 属性 
上 的 评论 来 获取 用 户 的 偏好 ， 从 而 最 小 化 干预 性 [1，68]。 也 有 一 些 经 验方 法 具有 和 较 低 的 
算法 复杂 度 [80]。 最 后 ， 在 多 准则 推荐 系统 中 可 以 进一步 研究 用 户 提 交 多 个 评分 对 用 户 满 
意 度 的 影响 。 

单 评分 推荐 技术 的 复 用 。 在 过 去 10~15 年 里 ， 人 们 提出 了 大 量 关于 单 评分 推荐 的 技 
术 。 有 一 些 技术 经 过 拓展 后 可 以 应 用 于 多 准则 推荐 系统 。 例 如 ，Manouselis 和 costopou- 
lou[51j 给 出 的 大 量 设计 建议 选项 ， 基 于 邻居 的 系统 过 滤 技 术 可 以 被 多 准则 评分 采用 。 另 
外 一 个 例子 是 ， 近 年 来 提出 了 大 量 的 复杂 混合 推荐 方法 [11]， 其 中 有 一 些 也 可 以 在 多 准则 
推荐 系统 中 应 用 。 另 外 其 他 一 些 更 复杂 的 技术 ， 如 基于 DEA 或 多 准则 优化 ， 都 可 以 被 采 
用 并 且 被 拓展 到 多 准则 评分 环境 中 选择 最 优 的 物品 。 

预测 相对 偏好 。 另 外 一 种 定义 多 准则 推荐 问题 的 方法 可 以 是 将 问题 定义 成 预测 用 户 的 
相对 偏好 ， 而 不 是 预测 绝对 评分 值 。 有 一 些 研究 采用 基于 顺序 (Order-based) 技 术 来 构建 物 
品 的 相对 顺序 。 例 如 ，Freund 等 [25] 在 知名 的 AdaBoost 方法 基础 上 开发 了 在 多 准则 环境 
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下 的 RankBoost 算法 ， 这 类 算法 可 以 通过 对 某 一 用 户 不 同 评分 准则 下 获取 的 相对 顺序 进行 
聚合 。 特 别 地 ， 在 DIVA 系统 中 也 采用 了 这 一 方法 [59，60]。 

构建 物品 评价 标准 。 我 们 需要 更 多 地 研究 如 何 选择 和 构建 一 个 最 佳 的 准则 集 来 评价 一 个 
物品 。 例 如 ， 目 前 大 多 数 的 多 准则 推荐 系统 需要 用 户 对 一 个 物品 的 多 个 属性 进行 评分 。 这 些 
单一 层次 的 评价 标准 可 以 进一步 细 化 为 子 准则 ， 划 分 的 层次 取决 于 给 定 的 问题 。 例 如 ， 在 一 
个 电影 推荐 系统 中 ， 电 影 的 特效 可 以 分 为 声音 特效 和 图 像 特效 。 多 级 准则 的 信息 可 以 帮助 更 
好 地 理解 用 户 偏好 ， 并 且 多 种 方法 ， 如 层次 化 分 析 过 程 (AHP) 可 以 被 用 于 考虑 准则 的 层次 
[78], Schmitt 等 L85] 在 它们 的 系统 中 采用 这 个 方法 。 我 们 在 考虑 物品 的 多 准则 时 需要 仔细 审 
视 准 则 之 间 的 相关 性 ， 因 为 准则 的 选择 对 推荐 质量 的 影响 很 大 。 此 外 ， 如 前 所 述 ， 拥 有 一 致 
的 准则 簇 对 一 个 特定 的 推荐 系统 是 非常 重要 的 ， 因 为 这 样 准则 才能 保持 单调 、 完 整 和 不 元 
余 。 总 之 ,构建 一 个 推荐 问题 的 准则 集 是 一 个 非常 有 趣 和 重要 的 研究 主题 。 

应 对 多 准则 评分 缺失 。 与 单 评分 推荐 系统 相 比 ， 多 准则 推荐 系统 需要 用 户 提供 更 多 的 
数据 ， 无 形 中 增加 了 数据 缺失 或 不 完整 的 可 能 性 。 应 对 数据 缺失 最 常用 的 方法 是 期 望 值 最 
K (expectation maximization) 算 法 [18]， 为 不 完整 数据 找到 最 大 可 能 性 的 估 值 。 文 献 [79] 
提出 了 一 种 概率 建 模 方法 来 使 用 EM 算法 对 多 准则 评分 中 缺失 的 评分 机 型 预测 。 其 他 技术 
的 可 用 性 需要 进一步 探索 ， 同 时 也 需要 研究 新 的 技术 来 应 对 多 准则 的 特性 ， 如 准则 间 的 可 
能 存在 依赖 关系 。 

多 准则 环境 下 的 群 组 推荐 。 一 些 面向 群 组 推荐 的 技术 也 可 用 于 多 准则 环境 中 。 根 据 文 
献 L31]， 通 过 聚合 部 分 用 户 的 多 样 性 偏好 得 到 群 组 偏好 模型 ， 同 样 ， 在 多 准则 评分 中 的 用 
户 对 物品 的 偏好 也 可 以 通过 聚合 不 同 准则 的 偏好 获得 。 更 确切 地 说 ， 在 个 性 化 偏好 聚合 过 
程 中 可 能 存在 不 同 的 目标 [55，63]， 例 如 ， 用 户 平均 满意 度 最 大 化 、 不 满意 度 的 最 小 化 或 
提供 一 定 程度 的 公平 性 。 多 准则 评分 推荐 系统 也 可 以 研究 采用 一 些 多 准则 偏好 的 聚合 
方法 。 

开发 新 的 MCDM 建 模 方法 。 从 MCDM 的 角度 来 讲 ， 推 荐 问题 使 决策 建 模 者 面临 新 
的 挑战 。 一 方面 ， 有 很 多 技术 可 以 应 用 到 该 系统 中 ， 例 如 ， 文 献 L[68] 中 提出 的 算法 中 的 
敏感 度 分 析 ; 另 一 方面 ,一 些 研究 表明 ， 推 荐 不 是 一 个 单一 决策 问题 ， 因 为 它 需 要 对 几 
个 决策 问题 同时 处 理 ， 每 个 人 都 会 影响 对 其 他 人 的 推荐 [54]。 既 不 是 典型 的 群 组 决策 ， 
也 不 是 个 体 协 商 [66]。 因 此 ， 需 要 提出 新 的 MCDM 建 模 方法 ， 并 在 多 准则 推荐 系统 中 
测试 L20] 。 

大 规模 的 多 准则 评分 数据 的 收集 。 可 以 用 来 进行 算法 测试 和 参数 化 的 多 准则 数据 集 非 
常 少 。 如 果 想 在 推荐 系统 的 这 一 新 领域 取得 成 功 ， 为 学 术 界 提 供 一 些 标准 的 现实 世界 的 多 
准则 评分 数据 集 是 非常 重要 的 。 一 种 面向 标准 化 表示 ， 复 用 和 互 操作 的 多 准则 评分 数据 集 
在 电子 学 习 领 域 中 已 经 有 了 初步 的 尝试 L[98] 。 

本 节 讨 论 了 多 准则 推荐 系统 领域 可 能 的 几 个 未 来 研究 方向 ， 而 推荐 系统 学 术 界 对 多 准 
则 推荐 系统 应 该 是 非常 感 兴趣 的 ， 这 个 列表 并 不 是 非常 详尽 ， 我 们 认为 该 领域 的 研究 仅仅 
处 于 起 步 阶段 ， 还 有 大 量 的 课题 可 以 被 研究 和 探索 ， 以 求 推动 多 准则 推荐 系统 研究 。 


24.7 总 结 


本 章 的 主要 目的 是 对 多 准则 推荐 系统 进行 综述 。 首 先 ， 我 们 将 推荐 问题 定义 为 多 准则 
决策 问题 (MCDM) ， 并 综述 了 支撑 多 准则 推荐 系统 实现 的 MCDM 方法 和 技术 。 接 着 ,我 
们 聚焦 于 多 准则 评分 推荐 技术 ， 这 一 技术 通过 建 模 用 户 对 每 个 物品 的 效用 作为 一 个 评分 向 
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量 与 其 他 属性 一 起 产生 推荐 ， 并 总 结 了 当前 采用 的 一 些 多 准则 评分 预测 和 产生 推荐 的 技 
术 ， 文 章 最 后 讨论 了 多 准则 推荐 系统 的 一 些 尚未 解决 的 问题 及 未 来 的 挑战 。 
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具有 健壮 性 的 协同 推荐 





Robin Burke, Michael P. O' Mahony 和 Neil J. Hurley 


摘要 协同 推荐 系统 容易 受到 恶意 用 户 的 攻击 ， 使 得 推荐 结果 产生 偏差 并 倾向 于 推荐 
(或 不 推荐 ) 某 一 些 物品 。 从 2002 年 开始 这 一 类 研究 就 属于 热门 研究 方向 。 研 究 者 已 经 发 
现 研 究 最 广泛 的 基于 内 存 的 算法 都 有 相当 简单 的 典型 攻击 漏洞 。 本 章 将 讨论 这 些 发 现 和 研 
究 结论 。 尤 其 包括 伪造 用 户 的 检测 方法 以 及 具有 健壮 性 的 推荐 算法 的 实现 方法 。 


25.1 简介 


协同 推荐 系统 需要 基于 用 户 的 正常 行为 。 通 过 “协同 ”字眼 我 们 可 以 看 到 某 种 潜在 的 意 
义 ， 即 一 定 程度 上 来 说 用 户 是 站 在 一 边 的 ， 至 少 都 是 希望 推荐 系统 能 提供 好 的 推荐 服务 ， 
同时 也 推荐 有 用 的 信息 给 和 他 们 相关 的 人 。 E N tee Wl 以 此 来 
描述 同事 之 间 进 行善 意 交 流 的 场景 是 与 推荐 场景 相似 的 。 

然而 ， 现 今 的 状况 显示 ， 网 络 并 不 仅 包含 善意 且 较 配合 的 用 户 。 在 和 推荐 系统 交互 的 
时 候 用 户 拥有 各 种 各 样 的 意图 ， 有 些 时 候 某 些 意图 会 和 系统 拥有 者 或 者 大 部 分 的 系统 用 户 
相悖 。 这 里 引用 一 个 例子 ，Google 搜索 引擎 发 现 自己 已 经 被 卷 人 了 一 场 持久 战争 中 ， 战 
争 的 对 方 一 直 寻 求 跟 检索 算法 博弈 的 方法 ， 以 提高 自己 所 拥有 的 网 站 的 检索 排名 。 

在 搜索 引擎 领域 中 ， 攻 击 者 的 目的 就 是 使 某 些 网 页 “看 起 来 ” 像 是 Google 在 考虑 所 有 
因素 之 后 对 检索 的 请 求 所 给 出 的 最 佳 答案 。 在 推荐 系统 领域 也 是 相同 情况 。 攻 击 者 的 目的 
就 是 要 把 某 件 商 品 或 者 物品 伪装 成 一 件 “ 合 适 ” 的 推荐 物 ， 推 荐 给 相应 的 用 户 。 攻 击 者 也 可 
能 通过 攻击 手段 阻止 某 件 合适 的 物品 被 推荐 出 来 。 如 果 推 荐 系统 仅 依赖 于 用 户 信息 ， 那 么 
攻击 者 就 一 定 会 通过 注 人 伪造 的 用 户 信 息 的 方式 去 促进 推荐 系统 的 结果 朝 着 自己 所 需要 的 
方向 走 。 单 个 的 用 户 信息 不 足以 改变 推荐 结果 ， 推 荐 系统 倾向 于 不 受 单个 数据 的 影响 。 攻 
击 者 为 了 左右 系统 的 推荐 结果 ， 必 须 伪 造 大 量 的 用 户 。 站 长 试 着 使 这 种 伪造 数据 的 注 和 人行 
为 代价 高 昂 ， 当 然 也 需要 权衡 一 下 ， 不 能 阻止 推荐 系统 正常 的 数据 的 输入 。 通 过 设计 用 户 
评分 数据 来 操控 推荐 结果 的 方法 在 文献 [24] 中 第 一 次 提 到 。 从 那 以 后 ， 研 究 者 开始 聚焦 于 
攻击 策略 、 攻 击 检测 策略 以 及 设计 及 健壮 的 推荐 算法 。 

图 25. 1 中 展示 了 研究 框架 。 研 究 表明 有 效 的 攻击 是 能 花费 较 少 的 代价 对 系统 产生 足 
够 的 影响 。 这 样 我 们 就 可 以 理解 图 中 在 不 同 攻击 效果 下 的 影响 力 曲 线 。 在 检测 攻击 的 研究 
中 主要 是 识别 出 伪造 的 用 户 组 并 且 从 系统 数据 库 中 删除 它们 。 低 效 的 攻击 很 难 被 检测 出 
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来 。 就 是 因为 它们 的 攻击 效果 不 好 ， 所 以 需要 大 量 的 伪造 用 户 才能 产生 效果 。 针 对 某 种 物 
品 的 大 量 的 用 户 评分 数据 流入 系统 中 是 容易 被 系统 监控 工具 检测 出 来 的 。 检 测算 法 的 研究 
者 主要 聚焦 于 有 效 攻击 的 算法 。 从 而 使 得 图 中 的 可 检测 区 域 扩 大 ， 进 一 步 限 制 攻击 的 范 
围 。 同 时 研究 者 已 经 设计 了 一 些 算法 能 够 对 攻击 更 健壮 ， 这 些 攻击 的 影响 力 曲 线 比 有 效 攻 
击 较 低 。 通 过 综合 上 述 研究 结果 ， 研 究 者 也 发 现 ， 并 不 需要 彻底 去 除 攻 击 效 果 ， 只 要 控制 
攻击 的 效果 达到 一 个 临界 点 ， 使 得 攻击 不 划算 即 可 。 








图 25.1 上 图 曲线 对 比 了 有 效 攻击 和 低 效 攻击 的 影响 力 。 阴 影 区 域 表 示 容 易 
被 检测 出 来 的 攻击 范围 


本 章 将 对 要 点 逐一 讲解 。 在 25. 3 节 ， 我 们 关注 一 些 针 对 协同 过 滤 推 荐 系统 的 攻击 算 
法 。25. 5 节 主 要 讲 攻击 的 检测 方法 ， 尤 其 是 图 25. 1 中 的 左 侧 阴 影 区 域 所 代表 的 有 效 攻 击 
的 检测 方法 。 在 最 后 25. 6 节 将 讲解 如 何 通过 健壮 性 的 算法 降低 攻击 的 影响 。 


25.2 问题 定义 


协同 推荐 系统 会 根据 用 户 新 增 的 数据 去 调整 推荐 结果 。 我 们 可 以 稍微 反 直 觉 地 假设 ， 
健壮 性 或 稳定 性 是 一 种 令 人 满意 的 系统 自 适 应 属性 。 攻 击 者 会 通过 注入 大 量 的 用 户 信息 来 
控制 推荐 结果 ， 具 有 健壮 性 的 推荐 系统 的 目的 就 是 要 阻止 这 种 攻击 行为 ， 即 用 户 信 息 注入 
攻击 。 

我 们 假设 任何 的 用 户 信 息 都 是 可 用 的 ， 也 就 是 说 ， 我 们 并 不 需要 用 户 的 评分 信息 符 
合 以 前 的 评分 ， 也 不 需要 符合 客观 感受 。 用 户 可 以 随意 选择 ， 并 且 用 户 非常 可 能 今天 表 
现成 这 样 ， 明 天 又 会 以 一 个 新 的 身份 登录 并 表现 成 男 外 一 个 样子 。 另 外 ， 一 些 类 似 攻 击 
行为 的 网 络 现象 并 不 是 攻击 。 例 如 ， 在 2008 年 秋天 ， 大 量 的 视频 游戏 粉丝 聚集 在 亚 马 
Hh A) Spore 游戏 主页 上 ， 大 家 只 是 在 这 个 页 面 上 抱怨 游戏 的 软件 版 权 问题 。 可 以 假定 这 
些 是 大 量 的 真实 用 户 行为 ， 并 且 他 们 的 投票 毫 无 疑问 在 一 段 时 间 内 左右 了 Spore 这 款 游 
戏 的 推荐 效果 。 这 些 用 户 的 行为 不 应 该 被 当成 攻击 。 目 前 还 不 清楚 是 否 存在 某 种 自动 化 
的 技术 能 够 识别 一 个 真实 用 户 的 评分 行为 是 真实 的 还 是 开玩笑 的 ， 或 是 一 次 不 诚实 的 
行为 。9 

作为 研究 的 目标 ， 攻 击 是 一 种 注入 大 量 伪造 的 用 户 信 息 ， 用 以 达到 影响 推荐 结果 的 


O 也许 有 人 会 争论 是 否 存在 这 种 方法 ， 但 是 运用 这 种 识别 方法 却 不 能 给 协同 推荐 系统 带 来 什么 好 处 。 
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目的 的 行为 。 攻 击 者 所 利用 的 每 个 独立 的 身份 被 称 为 攻击 用 户 信息 (attack profile), 3X 
些 攻 击 用 户 一 旦 被 创建 就 被 用 来 注 和 人 具有 偏好 的 用 户 信息 。 最 危险 的 攻击 是 那些 对 系统 
有 重大 影响 的 攻击 ， 如 此 多 的 研究 一 直 致 力 于 在 各 种 算法 上 寻求 最 有 效 和 实际 的 攻击 
手段 。 

尽管 会 有 随意 的 破坏 行为 ， 但 这 一 领域 的 研究 一 直 在 关注 一 种 专门 为 了 达到 某 种 特殊 
推荐 效果 的 攻击 。 推 举 产品 攻击 和 打压 产品 攻击 分 别 是 为 了 提高 和 降低 某 些 被 推荐 物品 的 
推荐 值 。 此 种 攻击 就 是 要 降低 竞争 者 的 推荐 效果 ， 进 而 使 得 自己 的 物品 能 得 到 好 的 推荐 
效果 。 

对 攻击 者 来 说 ， 好 的 攻击 能 够 利用 较 少 的 努力 去 得 到 最 大 的 影响 力 。 有 两 类 行为 可 以 
用 于 攻击 。 第 一 类 是 需要 设计 好 被 注入 的 用 户 信息 。 这 种 用 户 信 息 根 据 所 需 信息 量 又 可 以 
分 为 两 种 ， 充 分 信息 攻击 必须 在 攻击 前 知道 推荐 系统 的 详细 评分 分 布 。 例 如 ， 一 些 攻击 需 
要 知道 每 个 物品 评分 的 均值 和 标准 差 。 非 充分 信息 攻击 则 只 需要 不 依赖 于 具体 系统 的 信息 
知识 即 可 ， 像 在 公共 信息 源 中 能 获取 的 知识 。 

我 们 通常 假设 攻击 者 能 获取 到 推荐 系统 的 算法 类 型 。 攻 击 者 如 果 得 到 越 多 精确 的 推荐 
算法 信息 ， 则 越 能 设计 出 有 效 的 攻击 ， 这 种 攻击 会 利用 推荐 算法 的 某 种 数学 特性 提高 攻击 
效果 。 

第 二 类 可 用 于 攻击 的 事情 是 了 解 需要 多 少 用 户 信息 才 会 达到 攻击 效果 。 评 分 信息 不 够 
重要 就 是 因为 评分 容易 被 自动 化 的 攻击 手段 注入 。 许 多 网 站 会 采用 需要 人 工 干 预 的 在 线 注 
WIS. 通过 这 种 方法 ， 站 长 就 能 要 求 每 注册 一 个 新 用 户 都 必须 付出 一 定 代价 。 这 就 是 攻 
击 者 更 倾向 于 那些 需要 注 人 更 少 用 户 信息 的 攻击 手段 的 原因 。 


25.2.1 一 个 攻击 示例 


我 们 利用 图 25. 2 的 简单 推荐 系统 数据 来 演示 基于 用 户 信息 注入 的 攻击 原理 。 在 这 个 
例子 中 ， 攻 击 的 目标 是 降低 7 号 物品 的 推荐 值 (如 产品 打压 攻击 ) ， 为 此 有 几 个 用 户 信息 被 
注 和 (用户 i 到 用 户 m)。 
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图 25.2 以 上 简单 的 系统 数据 展现 了 可 信 的 用 户 信息 以 及 一 些 被 注入 的 攻击 信息 。 在 这 个 
例子 中 ， 将 预测 用 户 h 对 7 号 物品 的 取舍 ， 即 产品 打压 攻击 的 目标 
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我 们 只 需要 考虑 用 户 h 是 否 喜 欢 7 号 物品 。 在 第 一 个 示例 中 ， 我 们 忽略 被 注入 的 用 户 
信息 ， 只 考虑 可 信 的 用 户 信息 (用 户 a 到 用 户 g)。 不 管用 了 哪 种 推荐 算法 ， 推 荐 算法 认为 
用 户 a 到 用 户 f£ 的 喜好 代表 现 有 的 活路 用户， 并 且 这 些 用 户 都 喜欢 7 号 物品 ， 最 终 会 使 得 
推荐 系统 对 7 号 物品 做 正 向 判断 。 

如 果 攻 击 信息 也 被 考虑 进去 ， 那 么 结果 就 毫 无 疑问 会 被 改变 。 这 些 攻击 信息 的 偏好 也 
和 用 户 h 相似 ， 同 时 都 不 喜欢 7 号 物品 ， 这 样 推荐 系统 就 倾向 于 给 予 7 号 物品 一 个 负面 的 
评价 。 最 终 攻击 的 目标 达到 了 。25. 3 节 将 讨论 被 用 来 攻击 的 用 户 信息 如 何在 真实 的 系统 
中 产生 作用 。 


25.3 攻击 分 类 


基于 伪造 用 户 信息 的 攻击 需要 把 许多 用 户 信 息 单元 注入 推荐 系统 中 。 每 个 用 户 信 息 单 
元 由 一 组 (物品 ， 评 分 ) 单 元 组 成 。 每 个 用 户 信息 单元 是 一 组 物品 的 向 量 ， 每 个 物品 有 一 个 
评分 值 ， 并 且 给 予 没 有 评分 的 物品 null 值 。 定 义 目标 物品 作为 攻击 者 的 目标 ， 攻 击 者 可 
能 提高 也 可 能 降低 该 物品 的 推荐 值 。 一 般 还 会 有 随机 挑选 出 一 组 可 用 的 填充 物品 ， 定 义 为 
物品 集合 TI: 。 某 些 攻击 模型 也 会 利用 数据 库 之 外 的 物品 集合 。 这 组 挑选 的 物品 都 和 目标 物 
品 ( 或 目标 用 户 ) 有 一 定 的 相关 性 。 对 某 些 攻击 来 说 ， 这 个 集合 是 空 的 。 可 以 定义 为 ls。 最 
后 ， 定 义 集合 1g 包含 了 那些 没有 被 评分 的 物品 。 因 为 被 预选 出 的 物品 集合 较 小 ， 每 个 用 
户 信息 的 大 小 (评分 总 数 ) 是 由 填充 物品 集 Ie 大 小 决定 的 。 一 些 实验 结果 显示 ， 填 充 集 的 
大 小 随 着 I( 即 所 有 物品 的 集合 ) 的 大 小 而 定 。 


25.3.1 基础 攻击 


在 文献 L12] 中 最 先 描述 了 两 种 基本 的 攻击 模型 ， 随 机 攻击 模型 和 平均 攻击 模型 。 这 些 
攻击 方法 中 都 会 包含 伪造 用 户 的 构造 方法 ， 攻 击 方法 中 利用 随机 评分 的 方法 给 填充 物品 
评分 。 

25. 3. 1.1 随机 攻击 


在 随机 攻击 方法 所 利用 的 用 户 单元 中 ， 对 于 填充 物品 的 评分 采取 随机 的 评分 值 ， 评 分 
符合 以 所 有 物品 评分 均值 为 中 心 的 数据 分 布 。 目标 物品 的 评分 值 在 推举 攻击 方法 中 被 设置 
为 最 高 评分 值 rwx， 在 打压 攻击 方法 中 被 设置 成 最 低 评分 值 rv o 

发 起 攻击 所 需要 的 预备 知识 非常 少 ， 因 为 所 有 系统 的 总 体 评 分 均值 可 以 利用 外 部 经 验 
佑 出 来 (或 者 通过 推荐 系统 本 身 得 出 ) 。 然 而 随机 攻击 方法 却 并 不 十 分 有 效 [12，6] 。 
25.3.1.2 平均 攻击 


在 文献 [12] 中 描述 了 一 种 更 有 效 的 攻击 方法 ， 利 用 每 个 物品 的 评分 均值 代替 随机 攻击 
方法 中 的 全 局 均值 (除了 目标 物品 ) 。 在 平均 攻击 方法 中 ， 每 个 填充 物 评 分 值 的 数据 分 布 会 
《准确 地 或 者 相近 地 ) 符 合 该 物品 的 评分 平均 值 ， 该 平均 值 是 由 数据 库 中 已 有 的 用 户 评分 计 
算得 出 的 。 

与 随机 攻击 相同 ， 打 压 攻击 利用 rm 评分 代替 推举 攻击 中 的 rwx。 我 们 还 应 该 注意 的 
是 ， 平 均 攻击 方法 和 随机 攻击 方法 的 唯一 不 同 ， 是 用 户 单元 中 填充 物 的 评分 计算 方法 。 

平均 攻击 方法 可 能 需要 有 相当 大 的 信息 成 本 ， 像 需要 知道 填充 物品 列表 的 物品 个 数 
[Te | 。 这 些 填充 物品 的 评分 均值 和 标准 差 都 需要 提前 知道 。 然 而 ， 实 验证 明 平均 攻击 方法 
即使 在 使 用 小 规模 填充 物 集合 的 情况 下 也 能 攻击 成 功 。 因 此 攻击 所 需 的 信息 量 也 会 大 幅 地 


第 253 具有 健壮 性 的 协同 推荐 537 


缩减 ， 但 是 需要 付出 一 些 代 价 ， 伪 造 的 用 户 都 包含 相同 的 物品 列表 ， 这 样 会 使 得 这 些 伪 造 
的 用 户 引 人 注意 [4 。 


25.3.2 非 充 分 信息 攻击 


平均 攻击 方法 需要 攻击 者 了 解 相 当 多 的 目标 推荐 系统 的 相关 信息 。 一 个 合理 有 效 的 防 
卫 方 法 就 是 尽量 使 攻击 者 难以 获取 系统 的 评分 分 布 数 据 。 下 一 个 要 描述 的 算法 类 型 所 需要 
的 信息 量 将 非常 少 。 
25.3.2.1 流行 攻击 

流行 攻击 的 目的 是 把 被 攻击 的 物品 和 一 小 部 分 评分 频率 较 高 的 物品 关联 起 来 。 这 个 攻 
击 利用 了 消费 者 市 场 的 普及 率 的 分 布 模 型 (Zipf 分 布 )。 例 如 ， 畅 销 书 这 种 物品 在 书籍 整体 
中 占 比 并 不 高 ， 但 是 受到 了 绝 大 部 分 用 户 的 关注 和 评分 。 攻 击 者 用 这 个 模型 和 关注 率 较 高 
的 物品 去 伪造 用 户 信息 。 这 种 用 户 信息 会 更 可 能 贴近 大 部 分 的 用 户 ， 因 为 使 用 的 物品 都 被 
大 部 分 用 户 评分 过 。 这 个 方法 并 不 需要 推荐 系统 相关 的 信息 ， 因 为 很 容易 判定 在 任意 的 领 
域内 哪个 物品 是 最 热门 的 。 

流行 攻击 使 用 了 被 大 部 分 用 户 所 评 过 分 的 物品 。 这 些 物 品 和 目标 物品 i 都 同时 被 赋予 
了 最 高 分 。 填 充 物品 的 评分 被 随机 选 定 ， 就 像 随 机 攻击 方法 一 样 。 流 行 攻击 因此 也 可 以 被 
看 作 随 机 攻击 方法 的 一 个 拓展 方法 。 

就 像 在 25. 4 节 中 所 展示 的 那样 ， 对 于 基于 用 户 的 协同 过 滤 算 法 9 ， 流 行 攻击 像 平 均 攻 
击 方法 一 样 有 效 ， 但 是 又 不 用 受 “ 预 先 需要 了 解 目标 系统 ”的 限制 。 因 此 这 种 攻击 方法 更 容 
易 发 起 。 然 而 ， 就 像 平均 攻击 一 样 ， 攻 击 基于 物品 的 协同 过 滤 算 法 不 够 有 效 [12]。 
25. 3. 2. 2 ”分 段 攻击 | 

Mobasher 等 在 [19] 中 介绍 了 分 段 (segment) 攻 击 方 法 ， 并 证 明了 这 种 方法 在 攻击 基于 
物品 的 协同 过 滤 算 法 中 的 有 效 性 。 分 段 攻击 的 基本 算法 原理 是 ， 把 某 个 物品 引入 一 个 目标 
用 户 群 组 中 ， 同 时 这 个 目标 群 组 的 偏好 已 知 或 容易 被 预测 出 来 。 例 如 ， 慌 怖 电影 的 制 片 人 
可 能 希望 自己 的 电影 能 被 推荐 给 那些 喜欢 其 他 铠 怖 电影 的 观众 。 事 实 上 ， 制 片 人 其 实 并 不 
AIPM HEAR EKA MAM, AAS RAP RU, AMT A th RR 
露 了 。 

在 发 起 此 种 攻击 的 时 候 ， 攻 击 者 准备 好 一 些 目标 用 户 群 体 所 喜欢 的 物品 集合 。 就 像 流 
行 攻击 一 样 ， 很 容易 知道 某 个 用 户 群 体 所 共同 喜欢 的 物品 。 这 些 挑选 出 的 物品 和 目标 物品 
都 被 赋予 最 高 评分 值 。 为 了 最 大 化 对 基于 物品 的 推荐 算法 的 影响 力 ， 还 可 以 对 其 他 填充 物 
品评 最 低 分 ， 进 而 最 大 化 物品 相似 度 的 方差 。 


25.3.3 打压 攻击 模型 


以 上 提 到 的 所 有 攻击 模型 都 可 以 用 到 打压 攻击 中 。 例 如 ， 就 像 之 前 提 到 的 随机 和 平均 
攻击 模型 ， 把 攻击 目标 的 评分 值 与 评分 最 小 值 rm 联系 起 来 。 然 而 ，25. 4 节 中 的 结果 显 
示 ， 相 同 的 攻击 算法 对 提升 目标 推荐 效果 有 用 ， 但 不 一 定 在 压低 目标 推荐 值 方面 能 起 到 好 
的 效果 。 因 此 ， 研 究 者 额外 又 专门 为 打压 攻击 设计 了 一 些 方法 。 
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25.3.3.1 好 恶 攻击 

好 恶 (love/hate) 是 一 种 简单 的 攻击 方法 。 这 种 攻击 并 不 需要 对 目标 系统 了 解 。 在 被 用 
来 攻击 的 用 户 信 息 单 元 中 ， 目 标 物 品 被 设置 成 最 小 评分 值 rms， 相 反 其 他 的 填充 物品 的 评 
分 值 设 成 最 大 rwx 。 这 种 攻击 模型 也 可 以 被 认为 是 热门 (popular) 攻 击 的 非 充 分 信息 (low- 
knowledge) 版 本 。 令 人 吃惊 的 是 ， 这 个 方法 在 攻击 基于 用 户 的 推荐 算法 中 效果 最 佳 。 
25.3.3.2 逆流 行 攻 击 

道 流行 (reverse bandwagon) 攻 击 是 流行 攻击 的 一 个 变种 。 攻 击 中 选择 出 一 些 不 怎么 被 
用 户 评 分 的 物品 。 这 些 物 品 和 目标 物品 一 起 被 设置 成 低 分 。 因 此 目标 物品 就 和 不 被 用 户 喜 
欢 的 物品 关联 起 来 了 。 进 而 推荐 系统 则 会 给 目标 物品 较 低 的 评价 。 这 个 攻击 只 需要 事先 了 
解 较 少 的 信息 ， 如 用 户 不 喜欢 的 物品 有 哪些 。 在 电影 领域 ， 这 可 能 使 电影 在 首 映 式 前 导致 
票房 惨败 。 对 于 推荐 系统 方面 的 动作 将 高 度 优先 于 开幕 式 。 

在 25. 4 节 中 结果 显示 ， 针 对 压低 目标 推荐 效果 方面 ， 尽 管 该 AJ nud ST HP B 
推荐 算法 时 不 如 平均 攻击 有 效 ， 但 是 它 却 对 基于 物品 的 推荐 算法 十 分 有 效 。 


25. 3.4 知情 攻击 模型 


非 充 分 信息 攻击 有 些 近似 平均 攻击 ， 会 更 多 地 关注 热门 的 物品 。 攻 击 者 最 容易 想到 的 
攻击 方法 就 是 平均 攻击 ， 用 户 的 比较 是 基于 相似 度 的 ， 进 而 伪造 的 用 户 会 和 处 于 平均 范围 
的 用 户 相 近 。 如 果 攻 击 者 能 够 获得 更 多 目标 系统 的 信息 ， 那 么 也 可 以 设计 出 更 有 效 的 
攻击 。 
25.3.4.1 热门 攻击 


假设 推荐 系统 使 用 的 算法 是 被 广泛 研究 的 基于 用 户 的 协同 过 滤 算 法 L27]。 用 户 相 似 度 
通过 皮尔 逊 相似 度 计算 ?。 像 流行 攻击 一 样 ， 攻 击 用 的 用 户 信 息 单 元 会 选 出 一 组 评分 频率 
较 高 的 物品 。 

伪造 的 用 户 信 息 和 真实 用 户 评 分 的 物品 如 果 相 同 也 并 不 能 保证 相似 性 就 高 。 流 行 攻击 
使 用 随机 的 填充 物品 评分 来 造成 评分 扰动 ,同时 使 得 一 部 分 用 户 信息 能 和 某 类 固定 的 用 户 
相关 。 热 门 攻击 利用 了 物品 的 平均 分 ， 根 据 填充 物品 的 评分 是 否 高 于 平均 来 判断 给 予 
rmin 十 1 还 是 rmis。 将 评分 与 物品 的 平均 得 分 关联 起 来 ， 容 易 使 得 伪造 用 户 和 真实 用 户 的 评 
分 预测 偏 移 值 为 正 值 (参考 25. 4 节 )。 在 文献 [25j 中 详细 描述 了 该 算法 。® 

上 面 提 及 的 用 于 推举 攻击 的 评分 策略 可 以 稍 加 改动 ， 然 后 应 用 于 打压 攻击 。 保 持 为 正 
相关 ， 同 时 评分 预测 偏 移 值 为 负 ， 那 么 可 以 将 策略 改 为 ， 目 标 物品 评 为 最 低 分 reins RR 
被 选择 的 物品 的 评分 是 否 高 于 平均 分 ， 判 断 选 定 物品 的 分 值 是 ras 或 者 rusx 一 1。 

这 个 方法 对 于 预备 知识 的 需求 量 介 于 流行 攻击 和 平均 攻击 之 间 。 就 像 流 行 攻击 ， 关 注 
度 高 的 物品 很 容易 从 系统 中 找到 。 因 为 没有 填充 物品 ， 所 以 热门 攻击 将 需要 更 多 的 热门 物 
品 。 攻 击 者 需要 猜测 物品 的 相对 平均 的 偏好 程度 ， 作 为 评分 的 依据 。 这 些 评分 信息 可 能 从 
系统 本 身 获 取 ， 如 果 不 行 ， 也 可 以 从 系统 外 部 获取 ， 如 利用 正 向 和 负 向 的 评论 数 来 作为 某 
种 物品 的 被 喜好 倾向 。 


O 在 文献 [25] 中 讨论 了 知情 攻击 ， 其 中 提 及 多 种 相似 性 度量 。 并 表示 提 到 的 相似 性 度量 方法 没有 一 一 种 对 攻击 
有 抵御 能 力 。 

O 在 文献 [18] 中 也 提 到 了 一 个 最 优 推举 攻击 策略 。 这 个 示例 的 结论 是 最 大 化 伪造 用 户 与 真实 用 户 的 相关 性 是 
最 根本 的 目标 。 如 果 这 个 结论 是 对 的 ， 选 择 能 最 大 化 评分 预测 偏 移 值 的 伪造 用 户 评分 将 很 重要 。 
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25.3.4.2 探测 攻击 策略 

尽管 没有 针对 热门 攻击 可 检测 性 的 研究 ， 但 这 种 攻击 似乎 很 容易 就 能 被 检测 出 来 ， 因 
为 所 有 的 攻击 用 户 信息 都 完全 相同 ， 而 且 评 分 数据 库 中 ran 十 1 和 rm 这 样 的 评分 也 非常 
稀少 。 

一 个 略微 效果 差 一 点 的 方法 是 利用 原本 系统 的 推荐 结果 来 获取 合适 的 填充 物品 。 此 方 
法 是 探测 (probe) 攻 击 。 攻 击 者 只 需要 找到 一 个 种 子 用 户 ， 并 获取 这 个 用 户 在 推荐 系统 的 
推荐 结果 。 这 些 推荐 结果 是 通过 种 子 用 户 的 相 邻 用 户 产 生 的 ， 所 以 至 少 能 保证 这 些 用 户 评 
分 过 这 些 推 荐 物品 ， 并 且 预 测 的 分 数 也 能 和 这 些 用 户 相 关 。 可 以 想象 攻击 者 通过 反复 深入 
发 掘 可 以 影响 一 小 组 用 户 ， 或 者 扩大 发 掘 范 围 则 可 以 构建 平均 攻击 。 在 某 种 意义 上 ， 探 测 
攻击 提供 了 一 种 针对 推荐 系统 的 增 量 学 习 的 攻击 方法 。 

相对 于 热门 攻击 ， 这 种 方法 也 有 另外 一 种 优点 ， 即 不 需要 太 多 推荐 系统 的 预备 信息 
攻击 者 只 需要 选择 少 部 分 的 种 子 物品 ， 然 后 用 推荐 系统 确定 额外 的 物品 和 评分 。 如 25.4 
节 所 示 ， 种 子 物品 被 选 出 来 并 以 类 似 于 热门 攻击 的 方法 来 评分 。 


25.4 检测 系统 健壮 性 


协同 推荐 算法 可 以 分 为 两 个 类 别 ， 一 般 被 称 为 基于 内 存 的 算法 和 基于 模型 的 算法 [2]。 
基于 内 存 的 算法 利用 系统 中 的 所 有 可 用 数据 来 计算 并 预测 哪些 物品 可 以 被 推荐 出 来 。 相 
反 ， 基 于 模型 的 算法 是 利用 系统 数据 计算 出 一 个 模型 ， 此 后 这 个 模型 可 以 用 在 推荐 的 流 
程 中 。 

研究 文献 中 提出 了 大 量 协同 推荐 算法 ， 关 于 这 些 推荐 算法 的 健壮 性 研究 并 不 是 这 章 的 
主题 。 本 章 只 针对 两 种 主要 推荐 算法 进行 分 析 。 它 们 是 基于 用 户 的 推荐 算法 和 基于 物品 的 
推荐 算法 L[27，32]。 读 者 可 以 查阅 文献 [21，20，31] 来 获取 其 他 协同 推荐 算法 的 健壮 性 
分 析 。 


25.4.1 评估 和 矩阵 


因为 推举 攻击 和 打压 攻击 的 目标 是 提高 或 者 压低 目标 物品 的 推荐 值 ， 我 们 需要 评估 它 
们 的 攻击 效果 。 健 壮 性 评估 和 矩阵 需要 捕获 目标 物品 的 评分 预测 值 和 推荐 状态 (例如 ， 是 否 
被 包含 在 top 推荐 列表 ) 在 攻击 前 和 攻击 后 的 区 别 。 

许多 研究 者 利用 平均 预测 偏 移 值 来 评估 评分 预测 值 的 变化 量 。 定 义 Ur Ir 是 测试 用 户 
集中 的 用 户 集合 和 物品 集合 。 每 个 用 户 一 物品 对 (xu， 站 的 评分 预测 值 的 偏 移 量 定义 为 AL 
可 以 利用 公式 A 二 ps; 一 pi 来 计算 ,其 中 p 和 zp' 分 别 是 攻击 前 和 攻击 后 的 评分 预测 值 。 如 
果 偏 移 量 是 正 值 ， 则 说 明 推举 攻击 成 功 地 推荐 了 一 个 物品 。 物 品 i 的 平均 预测 偏 移 值 的 计算 
RA A = 2》)Aii/1Ur| 。 所 有 物品 的 平均 偏 移 值 的 计算 式 为 A = 24^ /\|Ir|. 


uEUT 


如 果 强 推 基 个 物品 的 行为 或 者 压制 某 个 物品 的 行为 可 以 表达 攻击 者 的 目的 ， 那么 预测 
偏 移 值 是 一 个 合适 的 指标 。 然 而 ， 有 可 能 强 推 的 物品 的 评分 预测 值 已 经 有 较 大 的 偏差 ， 但 
是 还 不 足以 使 这 个 物品 进入 推荐 列表 。 当 该 物品 的 初始 评分 值 就 很 低 时 ， 这 种 情况 就 会 发 
生 ， 即 使 攻击 使 得 评分 值得 到 很 大 的 提高 也 没 用 。 为 了 计算 攻击 对 推荐 列表 的 影响 程度 ， 
下 面 定 义 另 一 个 矩阵 : PRR. CXR. WAP u 的 前 top N 推荐 列表 。 如 果 目 标 物 
品 出 现在 R, 中 ， 则 对 于 用 户 x 来 说 五“ 被 定 为 1， 和 否则 为 0。 物品 守 的 命中 率 被 利用 以 下 
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公式 计算 HitRatio; = 》) Hi/1Ur | 。 平 均 命中 率 利用 所 有 物品 中 被 攻击 的 物品 i 的 命中 


率 总 和 除 以 物品 数量 而 得 到 : HitRatio = >) HitRaio;/ | I| 。 
i€IT 


许多 实验 者 利用 公开 的 数据 源 MovieLens 的 100K 大 小 的 数据 集 . 这 个 数据 集 包 含 来 
B 943 个 用 户 对 1682 部 电影 的 100000 个 评分 。 评 分 值 范围 是 1 一 5， 分 值 越 高 代表 越 喜 
欢 。 以 后 的 实验 结果 都 与 这 个 数据 集 有 关 ， 除 非 有 特殊 说 明 。 


25.4.2 推举 攻击 


为 了 了 解 推举 攻击 的 影响 情况 ， 我 们 可 以 查阅 文献 [20] 中 的 描述 。 在 这 些 图 中 ， 基 于 
用 户 的 推荐 算法 受到 各 种 程度 的 攻击 ， 这 种 攻击 程度 可 以 定义 为 注入 的 用 户 数 在 真实 用 户 
集中 的 占 比 。 因 此 如 果 是 1%% 的 攻击 程度 ， 则 对 于 MovieLens 数据 集 来 说 需要 注入 10 个 
用 户 。 图 25. 3 的 左 图 中 显示 平均 攻击 使 用 了 3% 的 填充 物品 ， 流 行 攻击 用 了 一 个 评分 次 数 
最 高 的 物品 和 3% 的 填充 物品 ， 随 机 攻击 用 了 6% 的 填充 物品 。 上 面 这 些 参数 是 该 攻击 的 
最 优 参 数 。 毫 无 疑问 ， 在 预测 偏差 方面 ， 预 备 知 识 量 最 密集 的 平均 攻击 的 效果 最 佳 。 这 种 
攻击 非常 有 效 。 它 能 够 把 一 个 只 有 平均 打分 的 电影 (均值 是 3. 6) 推 荐 到 前 五 的 位 置 。 流 行 
攻击 尽管 拥有 最 少 的 预备 知识 量 需 求 ， 但 是 攻击 效果 却 最 接近 平均 攻击 。 此 外 ， 流 行 攻击 
显然 优 于 随机 攻击 ， 更 加 重视 有 可 能 被 许多 用 户 评分 的 物品 。 
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图 25.3 左 图 展现 的 是 预测 偏 移 值 ， 右 图 是 命中 率 。 图 中 执行 的 是 推举 攻击 ， 攻 击 
目标 是 基于 用 户 的 协同 推荐 算法 。 命 中 率 是 在 攻击 量 为 10% 时 的 图 


有 趣 的 是 ， 图 25.3 的 右 图 显示 流行 攻击 拥有 最 大 的 攻击 命中 率 。 这 意味 着 评分 预测 
偏 移 值 对 于 top N 推荐 的 评估 来 说 并 不 一 定 是 必要 的 。 这 个 结果 会 促进 攻击 者 利用 流行 攻 
击 ， 因 为 它 的 预备 知识 量 需求 很 少 。 需 要 注意 的 是 所 有 攻击 之 后 的 命中 率 都 明显 地 好 于 攻 
击 前 的 命中 率 (图 中 定义 的 基线 ) 。 

文献 [12] 中 描述 了 ， 基 于 物品 的 推荐 算法 对 于 平均 攻击 具有 健壮 性 。 文 献 [19] 中 描 
述 ， 分 段 攻击 是 专门 针对 基于 物品 的 推荐 算法 的 一 种 低 预备 知识 需求 的 攻击 。 它 主要 提 
升 目标 物品 和 用 户 所 喜欢 的 物品 的 相似 度 。 如 果 目 标 物品 和 用 户 喜 欢 的 物品 相似 ， 则 目 
标 物品 在 系统 中 的 评分 预测 值 也 会 高 一 一 这 是 推举 攻击 的 目标 。 所 以 攻击 者 的 目标 就 是 
把 自己 的 产品 和 流行 的 物品 关联 起 来 ,让 人 觉 着 它们 是 相似 的 。 喜欢 这 些 相 似 物品 的 用 
户 被 认为 属于 一 个 目标 群体 。 发 起 分 段 攻击 的 攻击 者 就 是 要 选择 出 与 目标 物品 相近 的 物 
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品 作为 伪造 用 户 集 Is。 在 电影 的 领域 里 ,. 我 们 将 会 选择 看 流派 相似 的 电影 或 者 包含 相同 
演员 的 电影 。 

文献 [19] 中 ， 利 用 热门 演员 和 电影 流派 来 构建 用 户 群 组 。 如 图 25.4 所 示 ， 选 择 的 群 
组 由 以 下 用 户 组 成 : 用 户 给 Alien、Psycho、The Shining, Jaws 和 The Birds 37 2528 MB 
影 中 至 少 三 部 的 评分 大 于 平均 分 (4 分 或 5 分 )。 在 这 五 部 电影 中 ， 研 究 者 列 出 所 有 三 部 电 
影 的 组 合 情 况 ， 其 中 每 个 组 合 至 少 有 50 个 支持 者 ， 并 且 在 从 这 些 支持 者 中 随机 选择 出 50 
个 用 户 并 计算 平均 分 。 
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图 25.4 左 图 是 评分 预测 偏 移 值 ， 右 图 是 命中 率 。 实 验 是 针对 基于 物品 的 协同 过 滤 
算法 进行 推举 攻击 的 。 右 图 是 在 攻击 量 为 10% 的 时 候 的 命中 率 分 布 


在 图 中 通过 对 比 铠 怖 片 粉丝 群体 和 全 部 用 户 全 体 的 情况 ， 展 示 了 分 段 攻击 的 效果 。 很 
明显 分 段 攻击 成 功 地 把 目标 物品 推荐 到 目标 群体 中 。 在 攻击 基于 物品 的 推荐 算法 情况 下 ， 
攻击 效果 可 以 和 平均 攻击 比肩 。 例 如 ， 平 均 攻 击 在 针对 所 有 用 户 的 前 10 推荐 中 能 达到 
30% 的 命中 率 ， 此 时 攻击 量 为 10% 。 而 分 段 攻击 能 获得 相近 的 命中 率 ， 但 是 攻击 量 只 
需要 1. 

需要 注意 的 是 ， 尽 管 分 段 攻击 是 为 基于 物品 的 推荐 算法 而 设计 的 ， 但 是 它 对 于 基于 用 
户 的 推荐 算法 也 很 好 用 。 篇 由 有 限 ， 我 们 不 会 在 此 展示 实验 结果 ， 可 以 去 文献 L[20j 中 获取 
详细 资料 。 


25. 4.3 打压 攻击 


可 以 假设 打压 攻击 与 推举 攻击 相对 称 。 它 们 唯一 不 同 的 是 给 目标 物品 的 评分 以 及 预测 
分 值 的 影响 力 曲 线 。 然 而 我 们 的 实验 发 现 一 些 有 趣 的 现象 ， 同 样 在 一 些 攻击 模型 下 推荐 目 
标 物品 或 压制 目标 物品 ， 会 在 攻击 效果 上 有 差别 。 评 分 数据 的 分 布 情况 应 该 作为 考虑 的 因 
素 ， 例 如 ， 在 MovieLens 数据 集中 低 分 数据 很 少 ， 所 以 低 分 数据 在 目标 物品 的 评分 预测 上 
占有 较 大 影响 。 如 在 top N 推荐 中 ， 推 荐 出 来 的 评分 基线 值 (普通 电影 能 进 推荐 列表 的 评 
分 值 ) 非 常 低 ， 在 大 小 为 50 的 列表 中 基线 值 为 0. 1。 要 把 一 个 物品 从 推荐 列表 中 压 下 去 其 
实 并 不 需要 花费 太 多 力气 。 . i 

在 好 恶 攻击 中 ， 随 机 选择 的 3% 填充 物品 被 赋予 了 最 高 分 ,目标 物品 被 赋予 最 低 分 。 
对 逆流 行 攻击 (针对 基于 物品 的 算法 ) 来 说 ， 有 着 最 低 平均 评分 的 物品 在 以 系统 的 最 低 平 均 
SAME TH mh. ED. 3 节 有 详细 的 讨论 。 实 验 中 的 被 选 物品 集合 | 1s | =25, 
其 中 每 个 电影 至 少 有 10 个 用 户 评分 。 

在 图 25. 5 中 展示 了 所 有 攻击 模型 的 实验 结果 。 尽 管 在 好 恶 攻击 中 所 需要 的 系统 预备 
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知识 很 少 ， 但 是 其 在 攻击 基于 用 户 的 推荐 算法 中 展示 了 最 佳 攻 击 效果 。 在 其 他 打压 攻击 
中 ， 流 行 攻击 超过 了 平均 攻击 ， 都 与 上 文 提 到 的 推举 攻击 的 结果 不 同 。 
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图 25.5 左 图 展示 的 是 打压 攻击 对 基于 用 户 的 推荐 算法 的 评分 预测 偏 移 值 ， 右 图 是 


针对 基于 物品 的 推荐 算法 


这 些 实验 结果 和 推举 攻击 的 数据 的 不 相称 之 处 令 人 惊讶 。 例如， 好 恶 攻击 在 针对 基于 
用 户 的 算法 的 推举 攻击 中 使 用 10 多 的 攻击 量 ， 能 够 得 到 正 向 的 评分 预测 偏 移 值 并 只 略 高 于 
1.0， 这 个 攻击 效果 相对 于 随机 攻击 低 不 少 。 然 而 ， 当 其 用 于 打压 基于 用 户 算法 下 物品 的 
时 候 ， 这 个 模型 却 是 我 们 试 过 的 最 有 效 的 模型 。 攻 击 的 评分 预测 偏 移 值 达到 了 平均 攻击 的 
两 倍 。 在 推举 攻击 中 ， 平 均 攻 击 是 最 成 功 的 ， 却 在 打压 攻击 方面 是 攻击 效果 最 低 的 攻击 之 
一 。 在 推举 攻击 方面 ， 流 行 攻击 和 平均 攻击 有 相近 的 攻击 效果 ， 在 打压 攻击 中 也 有 较为 优 
秀 的 攻击 效果 ， 尽 管 它 只 需要 较 少 的 系统 预备 知识 。 

总 体 来 说 ， 基 于 物品 的 推荐 算法 有 更 高 的 健壮 性 。 针 对 基于 物品 的 推荐 算法 ,平均 攻 
击 是 打压 攻击 中 最 有 效 的 攻击 ， 逆 流行 略 低 。 推 举 攻击 和 打压 攻击 的 不 对 称 性 在 基于 物品 
的 算法 攻击 中 得 到 验证 。 随 机 攻击 和 好 恶 攻 击 在 推举 攻击 类 别 中 属于 差 攻击 效果 的 一 类 。 
但 是 在 打压 攻击 类 别 中 却 得 到 了 比较 好 的 结果 。 在 针对 基于 物品 的 推荐 算法 的 打压 攻击 
中 ， 逆 流行 被 证 明 是 一 种 有 效 的 、 同 时 是 低 预备 知识 需求 的 攻击 。 


25.4.4 知情 攻击 


最 后 我 们 来 评估 一 下 针对 基于 用 户 推荐 算法 的 知情 攻击 策略 。 特 别 地， 我 们 会 拿 知情 
热门 攻击 与 探测 攻击 与 前 面 提 到 的 平均 攻击 比较 。 70% 

攻击 实现 如 下 所 述 。 热 门 攻击 的 伪造 用 户 信息 。 6o% 
包含 100 个 物品 (包括 目标 物品 )， 并 且 依 照 25.3 50% 
节 的 规则 进行 评分 。 在 探测 攻击 中 ， 种 子 物品 的 选 ” 疯 40% 
择 方法 如 下 ， 从 推荐 系统 中 选 出 100 个 最 常 被 评分 E30% 
的 物品 ， 并 随机 从 中 选择 10 个 。 此 后 再 不 断 获 取 ?0% 
通过 系统 给 种 子 物品 推荐 出 的 物品 和 评分 ， 补 充 伪 10% 
” 造 用 户 的 物品 列表 。 最 终 探测 攻击 需要 100 个 物 ” 











品 。 作 为 基准 线 的 平均 攻击 也 同样 选择 100 物品 ， 攻击 量 (%) 

这 将 占 到 填充 物品 集 的 1.7% 。 为 了 比较 ， 平 均 攻 图 25.6 图 中 展示 了 热门 、 探 测 和 平均 攻 
击 的 伪造 用 户 将 使 用 100 最 常 评 分 的 物品 (并 不 是 击 ( 推 举 攻击 ) 对 基于 用 户 的 推荐 
像 之 前 那样 随机 选择 物品 ) 。 算法 进行 攻击 的 命中 率 曲线 


图 25. 6 展现 了 这 三 种 攻击 的 命中 率 指 数 。 图 中 显示 知情 攻击 相对 于 平均 攻击 更 加 有 
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效 。 例 如 ， 当 供给 量 为 2% 且 取 toplo 时 ， 热 门 、 探 测 、 平 均 三 个 攻击 的 命中 率 分 别 为 
65%、34% 和 和 3%。 因此， 考虑 推荐 算法 的 一 些 特殊 属性 被 证 明 是 很 有 效 的 。 

知情 攻击 的 主要 缺点 是 需要 获取 大 量 被 攻击 系统 的 信息 才能 选择 出 合适 的 物品 和 评 
分 ， 进 而 构造 出 合适 的 伪造 用 户 。 像 25. 3 节 中 所 讨论 的 ， 这 种 攻击 者 用 的 预备 信息 是 直 
接 来 自 于 作为 攻击 目标 的 推荐 系统 。 这 种 预备 信息 可 以 从 很 多 渠道 获得 ， 如 最 佳 售卖 者 列 
表 、 物 品 的 正 向 和 负 向 的 评论 数 等 。 即 使 有 些 场景 下 只 能 获取 到 部 分 信息 ， 以 前 的 实验 结 
果 也 证 明知 情 攻 击 也 有 很 强 的 攻击 效果 [26] 。 


25.4.5 ”攻击 效果 


通过 如 上 研究 总 结 ， 作 为 协同 推荐 系统 主要 部 分 的 基于 内 存 的 算法 很 容易 受到 攻击 。 
攻击 者 只 需要 掌握 很 少 的 系统 信息 就 可 以 使 得 目标 物品 出 现在 用 户 的 推荐 列表 中 。 这 种 有 . 
效 的 攻击 是 建造 高 稳定 性 和 可 用 性 的 推荐 系统 的 障碍 。 因 此 我 们 有 需要 关注 图 25.1 曲线 
中 的 规模 低 / 影 响 力 高 的 那 一 部 分 攻击 。 

为 了 解决 这 个 问题 ， 有 两 种 对 应 的 解决 方案 。 一 个 是 研究 图 25. 1 中 的 阴影 检测 区 域 ， 
检测 出 伪造 用 户 并 删除 。 第 二 个 方向 是 设计 出 受 那 些 对 经 典 算法 奏效 的 攻击 影响 少 的 推荐 
算法 。 


25.5 攻击 检测 


图 25. 7 总 结 了 攻击 检测 系统 的 组 成 部 分 。 这 是 一 个 二 元 分 类 问题 ， 对 于 每 个 用 户 信 
息 有 两 种 可 能 答 出， 也 就 是 真实 ( 即 分 类 器 把 输入 用 户 信息 判定 为 真实 的 系统 用 户 ) 和 攻击 
( 即 分 类 器 把 这 种 输入 用 户 信息 判定 为 攻击 者 制造 出 来 的 ) 。 像 文献 [7，1] 中 所 述 的 ， 一 种 
检测 攻击 的 方法 是 独立 判定 每 个 用 户 信息 是 否 是 一 个 攻击 用 户 。 见 图 25. 7 中 的 单个 用 户 
信息 输入 部 分 。 这 个 输入 是 一 个 评分 向 量 7,，u 为 数据 库 中 的 用 户 。 在 进入 分 类 器 之 前 ， 
会 先 通过 特征 提取 步 又 提取 出 一 个 特征 集合 ，r, BIER Jom (e s fide Sa 
为 分 类 器 的 输入 。 输 出 是 真实 用 户 或 者 攻击 用 户 。 如 果 分 类 器 是 有 监督 分 类 器 ， 它 的 训练 
集 就 是 包含 带 标 注 的 用 户 信息 集合 ， 例 如 ， 带 有 真实 用 户 标签 和 攻击 用 户 标签 的 用 户 单元 
集合 。 利 用 训练 集 可 以 学 习 出 分 类 器 的 参数 。 

在 许多 攻击 场景 中 ， 会 通过 许多 
组 的 攻击 用 户 集 攻击 来 达到 推举 或 打 | 单个 用 户 信息 
压 目标 物品 的 目的 。 如 文献 [16，23] 
中 描述 的 那样 ， 考 虑 攻击 用 户 群 组 对 
构建 有 效 的 分 类 器 很 有 帮助 。 在 图 中 
定义 为 “用 户 信息 组 ”输入 ， 分 类 器 会 
把 整个 用 户 组 当成 一 个 输入 。 经 过 特 
征 提取 步 又 之 后 ， 并 给 用 户 组 中 的 每 
个 用 户 标 上 标签 。 我 们 需要 知道 ， 在 
任意 一 个 场景 中 并 不 是 每 个 步 又 都 需 
要 执行 。 例 如 ， 当 /一 r 时 ， 就 可 能 
没有 特征 抽取 步 又 ， 采 用 无 监督 分 类 
器 时 ， 就 没有 必要 经 过 训练 阶段 。 图 25.7 检测 过 和 
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25.5.1 评估 和 矩阵 


为 了 评估 不 同 的 检测 系统 ， 我 们 主要 关心 评估 分 类 器 的 效果 。“ 正 向 ”分 类 表明 一 条 用 
户 信息 被 判定 为 攻击 ， 分 类 数据 中 包含 四 种 数据 ， 如 真正 (true positive) 和 真 负 (true nega- 
tive) 代 表 被 正确 判定 为 攻击 用 户 和 真实 用 户 。 相 反 ， 另 外 两 个 是 假 正 (false positive) 和 假 
fa (false negative) ， 分 别 代 表 被 错误 地 分 类 为 攻击 用 户 或 者 真实 用 户 。 文 献 中 有 许多 评测 
方法 计算 以 上 定义 的 四 种 数据 。 遗 憾 的 是 ， 不 同 的 研究 者 用 了 不 同 的 评测 方法 ， 直 接 比较 
不 同 分 类 算法 的 效果 往往 很 难 。 

精确 度 (precision) 和 召回 率 (recall) 常 用 在 信息 检索 领域 中 。 在 这 种 场景 下 ， 它 们 通过 
识别 攻击 来 评估 分 类 器 的 性 能 。 每 个 评估 量 计算 被 正确 分 类 的 攻击 用 户 的 个 数 。 召 回 率 也 
被 命名 为 灵敏 度 (sensitivity)， 它 代表 被 正确 分 类 的 攻击 用 户 占 所 有 真正 的 攻击 用 户 集合 
中 的 比例 。 精 确 度 也 可 以 被 命名 为 正 向 预测 值 (positive predictive value, PPV), RRR 
正确 分 类 的 攻击 用 户 在 所 有 被 分 类 为 攻击 用 户 的 集合 中 所 占 的 比例 。 


ii 真正 的 数量 
召 加 率 三 灵敏 度 一 下 二 的 数量 十 假 负 的 训 量 

= 真正 的 数量 
精确 度 二 PPV 责 让 的 数量 十 候 正 的 狼 重 (25. 1) 


同样 的 评测 方法 也 可 以 利用 真实 用 户 的 识别 率 来 计算 。 我 们 定义 特异 度 (specificity) 为 被 
正确 分 类 的 真实 用 户 的 集合 在 所 有 真正 的 真实 用 户 集合 中 所 占 的 比例 。 同 样 也 有 负 向 预测 
fÈ (Negative Predictive Value，NPV) ， 代 表 被 正确 分 类 的 真实 用 户 在 所 有 被 分 类 为 真实 用 
户 的 集合 中 所 占 的 比例 。 


本 真 负 的 数量 
HAR Pa RRETRE ARE 
—. 真 负 的 数量 — 
NEY 一 页 抽 的 数量 十 假 负 的 狐 重 
在 下 面 的 实验 结果 中 ， 我 们 会 使 用 到 精确 度 、 召 回 率 、 特 异 度 和 NPV. 
25.5.1.1 攻击 性 能 


真实 用 户 的 误 分 类 会 导致 真实 的 用 户 数据 被 删除 ， 进 而 降低 系统 的 推荐 效果 。 一 种 评 
佑 这 种 影响 的 方法 就 是 计算 过 滤 攻 击 用 户 前 后 的 推荐 平均 绝对 误差 (MAE) 。 当 然 从 好 的 
方面 看 ， 删 除 攻击 用 户 会 减少 攻击 影响 。 假 设 攻击 是 推举 攻击 或 者 打压 攻击 ， 评 估 攻 击 被 
影响 的 程度 ， 可 以 计算 攻击 用 户 在 检测 过 滤 前 后 对 目标 物品 的 评分 预测 值 。 


25.5.2 单 用 户 检 测 


单 用 户 检测 的 基础 规则 是 攻击 用 户 的 评分 分 布 会 和 真实 用 户 的 评分 不 同 ， 因 此 每 个 攻 
击 用 户 可 以 通过 这 些 不 同 点 被 识别 出 来 。 就 其 本 身 而 言 ， 单 用 户 检测 是 一 种 基于 统计 的 检 
测 问题 。 攻 击 者 会 不 断 地 减 小 攻击 用 户 和 真实 用 户 的 统计 差别 ， 进 而 减 小 被 检测 出 来 的 可 
能 性 。 从 另 一 个 方面 来 说 ， 一 个 划算 的 攻击 会 尽 可 能 地 包含 特别 有 影响 力 的 用 户 信息 ， 例 
如 ， 一 个 需要 被 推荐 出 去 的 物品 应 该 被 评 为 高 分 ， 而 其 他 填充 物品 则 需要 被 设置 成 能 够 扒 
出 目标 物品 的 分 值 。 结 果 ， 明 显 的 攻击 特征 就 体现 出 来 了 ， 以 下 是 另外 一 些 攻击 特征 : 与 
系统 的 平均 分 差距 太 大 ， 或 者 一 条 用 户 信 息 里 面 有 不 寻常 的 评分 个 数 [1]。 


(25. 2) 
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25. 5. 2. 1 无 监督 检测 

在 文献 [7j 中 描述 了 一 种 无 监督 的 单 用 户 检 测 方法 。 检 测 基 于 攻击 用 户 的 普通 属性 。 
例如 ， 在 用 户 信息 里 存在 高 于 平常 值 的 评分 偏差 ， 这 种 用 户 单元 会 和 相近 的 用 户 有 超 乎 寻 
常 的 相似 度 。 人 们 会 衡量 这 些 属性 ， 并 用 它们 计算 一 条 用 户 信息 是 攻击 用 户 信息 的 概率 。 
25.5.2.2 有 监督 检测 

基于 监督 的 检测 方法 强调 选择 攻击 用 户 所 使 用 的 特性 ， 并 把 这 些 特性 提取 成 特征 向 量 
输入 分 类 器 。 通 常 利用 观察 的 方式 ， 会 提取 一 些 不 同 攻击 方法 都 共有 的 特性 ， 也 会 从 一 些 
特殊 的 攻击 算法 中 提取 一 些 特殊 属性 。 

在 文献 L[5] 中 ， 基 于 文献 [7] 中 提出 的 哪些 用 户 属性 ， 同 其 他 类 似 属 性 一 起 被 包含 在 一 
个 特征 向 量 里 ， 并 输入 有 监督 分 类 器 。 此 外 ， 另 外 一 些 在 用 户 信息 中 基于 填充 物 和 目标 物 
品 统计 出 来 的 特征 属性 (而 不 是 整 条 用 户 信息 ) 被 提出 来 。 例 如 ， 填 充 物 平均 方差 被 定义 为 
用 户 信息 中 被 填充 部 分 的 评分 的 变化 量 ， 这 个 特征 被 用 来 识别 平均 攻击 。 填 充 物 平均 目标 
差 被 定义 为 目标 物品 的 平均 得 分 和 填充 物品 的 平均 得 分 ， 被 用 来 检测 流行 攻击 。 

作者 使 用 了 三 种 有 监督 的 分 类 器 : kNN、C4.5 和 SVM。kNN 分 类 器 在 训练 集中 ， 
利用 用 户 信息 的 检测 属性 发 现 &=9 的 类 别 ， 相 似 度 使 用 的 是 皮尔 逊 相关 系数 (Pearson 
correlation). 。C4. 5 和 SVM 算法 被 以 同样 的 方法 构造 ， 只 基于 检测 属性 去 分 类 用 户 信息 。 
在 图 25.8 中 展现 了 针对 1%% 攻 击 量 的 平均 攻击 的 检测 结果 ， 横 轴 是 填充 物品 的 数量 。 
SVM 和 C4. 5 在 识别 攻击 用 户 方面 具有 完美 的 性 能 。 但 是 它们 相 较 于 kNN 算法 错误 分 类 
了 许多 真实 用 户 。 在 针对 1% 攻 击 量 情况 中 ， 在 填充 物品 数量 的 整个 范围 内 ，SVM 的 召回 
率 和 特异 度 是 最 佳 的 。 
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图 25.8 图 中 展现 的 是 三 种 分 类 算法 对 1%% 攻 击 量 的 平均 攻击 的 检测 效果 对 比 图 ， 左 
图 是 召回 率 ， 右 图 是 特异 度 
对 真实 用 户 的 误 分 类 所 造成 的 影响 程度 通过 计算 过 滤 前 后 的 MAE 值 来 评估 。 通 过 观 
察 ， 当 评分 值 为 1~5 WHR, MAE 值 的 增长 会 少 于 0.05。 在 过 滤 攻 击 用 户 之 后 ， 攻 击 
有 效 性 被 大 大 地 降低 ， 攻 击 的 有 效 性 是 利用 目标 物品 的 评分 预测 偏 移 值 来 评估 的 。 三 种 分 
类 算法 都 很 好 地 降低 了 攻击 效果 ， 特 别 是 在 低 攻 击 量 的 时 候 。SVM 算法 在 攻击 量 小 于 
10% 的 时 候 ， 在 整个 范围 内 能 使 评分 不 产生 偏 移 。 


25.5.3 MAPARI 


在 文献 [23，33，18] 中 提出 了 一 些 无 监督 的 伪造 用 户 组 识别 方法 。 通 常 这 些 算 法 利用 
聚 类 算法 来 区 分 攻击 用 户 组 和 真实 用 户 组 。 
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25. 5. 3. 1 近邻 过 滤 

文献 [23] 中 提出 了 一 个 无 监督 检测 和 过 滤 方 法 。 这 个 方法 并 不 是 在 预 处 理 阶 段 过 滤 用 
户 信息 ， 而 是 在 给 某 个 物品 预测 评分 值 的 时 候 对 活跃 用 户 的 近邻 用 户 信息 进行 过 滤 。 这 个 
方法 对 于 针对 热门 物品 的 攻击 用 户 有 优势 。 这 个 策略 基于 文献 [8] 中 提出 的 算法 。 背 景 是 
信用 评级 系统 ， 这 个 系统 给 在 线 市 场 中 的 买 家 和 卖家 进行 评级 ， 其 中 恶意 机 构 会 通过 欺骗 
的 行为 恶意 提高 他 们 的 信用 评级 。 这 个 算法 把 近邻 的 用 户 组 分 为 两 个 群 。 对 类 别 中 的 数据 
进行 统计 分 析 ， 如 果 发 现 攻击 用 户 ， 并 找 出 在 哪个 组 中 包含 攻击 用 户 ， 在 这 个 组 中 的 所 有 
用 户 信息 将 被 删除 。 

聚 类 方法 使 用 了 文献 L13]Macnaughton-Smith 100% 
分 裂 聚 类 方法 。 然 后 ， 比 较 每 个 组 内 的 热门 物品 的 ao, 
评分 数据 分 布 。 因 为 攻击 者 的 目标 是 把 目标 物品 的 
评分 值 改 成 一 个 特殊 值 ， 所 以 有 理由 相信 在 攻击 用 忆 
户 组 中 的 目标 物品 的 评分 值 会 和 真实 用 户 组 中 的 评 840% 
分 均值 有 较 大 差异 。 当 两 个 聚集 类 别 的 评分 均值 差 roy, 
异 较 大 时 ， 可 以 判定 发 生 过 攻击 。 具 有 较 小 均 方 误 | 
差 可 以 被 判定 为 攻击 用 户 组 。 











图 25. 9 中 展示 了 在 Movielens 数据 集中 ， 进 行 攻击 量 〈%) 
知情 打压 攻击 时 这 个 算法 的 检测 评估 结果 (包括 精 图 25.9 图 中 展示 了 近邻 过 滤 方 法 的 统计 
确 度 和 NPV) 。 在 所 有 攻击 量 下 ， 真 实用 户 被 正确 曲线 。Y 轴 是 精确 度 和 NPV，X 


分 类 为 真实 用 户 的 比率 基本 上 在 75% 以 上 。 可 以 说 ee 


明 攻 击 用 户 被 很 好 地 过 滤 了 。 然 而 当 攻 击 量 比较 小 时 ， 许 多 攻击 用 户 被 误 认 为 了 真实 用 
户 。 去 除 攻击 用 户 的 代价 就 是 要 去 除 一 些 真实 用 户 ， 可 能 会 影响 评分 预测 的 准确 度 。 当 去 
过 滤 一 个 没有 被 攻击 的 系统 时 ，MAE 大 概 有 10% HK, 
25. 5. 3. 2 ”基于 用 户 信息 聚 类 检测 攻击 

在 文献 [18] 中 得 到 的 观察 是 ， 攻 击 用 户 信息 之 间 都 互相 高 度 相 关 ， 同 时 和 许多 真实 用 
户 很 相似 。 这 个 发 现在 概率 潜在 语义 分 析 (PLSA) 和 主 成 分 分 析 (PCA) 的 帮助 下 ， 推 动 了 
采用 聚 类 方法 检测 攻击 方法 的 发 展 。 

在 PLSA 模型 中 [11]， 未 观测 因素 的 变量 Z= {z ，…，z} 与 每 个 观测 值 相关 联 。 在 
协同 过 滤 领 域内 ， 观 测 值 相 对 应 于 用 户 一 物品 对 的 评分 。 并 且 用 以 下 公式 进行 计算 : 


k 
Pr(u,i) = >) Pr(z,)Pr(u|z;)Pr(i|z,) 
i=l 


利用 期 望 最 大 值 算法 选择 这 个 表达 式 的 参数 ， 来 最 大 化 观测 数据 的 似 然 概率 。 像 文献 
[21] 中 所 讨论 的 那样 ， 参 数 Pr(u|z;) 被 用 来 产生 一 类 用 户 ， 如 果 Prule) BUT BUA p 
KAP uw EAA C, REM Pr(u|z;) 超 不 过 阐 值 的 时 候 ， 最 大 化 Pr(u|z,) 也 能 定 为 
BR. 

在 文献 [18] 中 提 到 ， 大 部 分 的 攻击 用 户 都 倾向 于 被 定 为 单独 的 一 个 用 户 组 。 识 别 包含 
攻击 用 户 的 用 户 组 提供 了 一 种 有 效 的 过 滤 方 法 。 我 们 可 以 直觉 地 认为 包含 伪造 用 户 的 组 内 
用 户 信 息 之 间 会 更 相似 。 每 个 组 内 的 用 户 信息 之 间 计 算 了 马 氏 距离 ， 并 计算 平均 值 ， 最 后 
通过 最 小 距离 来 过 滤 。 实 验证 明 利用 PLSA 来 进行 攻击 检测 ， 在 强 的 攻击 中 效果 很 好 ， 但 
是 在 弱 的 攻击 中 容易 把 攻击 用 户 分 散在 不 同 的 组 中 ， 导 致 检测 效果 差 。 
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第 二 种 方法 是 发 掘 攻击 用 户 之 间 的 高 相似 度 性 。 在 文献 [18] 中 描述 了 一 种 基于 用 户 信 
息 的 协 方差 矩阵 的 PCA 的 检测 方法 。 这 种 方法 的 本 质 就 是 将 每 个 用 户 信息 之 间 的 方差 最 
大 化 。PCA 被 广泛 用 于 高 维 数据 的 降 维 处 理 中 。 这 种 方法 通过 维度 来 识别 用 户 类 别 ， 像 
文献 L[18] 中 描述 的 那样 ， 通 过 PCA 可 以 去 除 那些 高 度 相 关 的 维度 。 对 于 组 C， 我 们 可 以 
一 个 指示 向 量 y， 其 中 当 wu;EC 时 y(i)= 二 1， 否 则 y(i) = 二 0。 定 义 $S 为 协 方差 矩阵 ，C 

中 所 有 的 用 户 信 息 的 协 方差 和 可 以 写成 如 下 二 项 式 形式 : 

y'Sy = > S(i,j) 

I€C.jec 


S 的 特征 向 量 为 x;,， 相 关 的 特征 值 为 X;， 其 中 久 二 … 二 4,,， 二 项 式 : 
y'Sy = Mo. x;)? (x7 Sx;) = Moa Ài 


文献 [18] 中 所 描述 的 方法 可 以 理解 成 寻找 最 大 化 以 上 二 项 式 的 二 元 向 量 y， 其 中 比较 小 特 
征 值 所 对 应 的 3 一 5 个 特征 向 量具 有 弱 相 关 性 ， 而 大 的 特征 值 所 对 应 的 特征 向 量具 有 强 相 
Xt. 

在 图 25. 10 中 展现 了 PLSA 和 PCA 的 精确 度 和 召回 率 ， 实 验 的 平均 攻击 量 是 10%， 
对 于 随机 和 流行 攻击 都 有 相似 的 结果 。PLSA 和 PCA 算法 需要 指定 过 滤 的 范围 ， 在 实验 
结果 中 ， 过 滤器 大 小 根据 攻击 量 来 设 定 。 所 以 需要 参考 来 自 于 近邻 过 滤 策略 的 结果 (图 
25.9), ， 而 不 需要 去 控制 过 滤器 的 范围 。PLSA 获得 最 高 80%% 的 召回 率 ， 是 因为 大 概 
20% 的 错误 分 类 。PCA 的 处 理 效果 不 错 ， 即 使 攻击 使 用 了 随机 、 平 均 以 及 流行 的 混合 
形式 的 攻击 用 户 。 
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25.10 左 图 中 展现 了 PLSA fü PCA 的 精确 度 和 召回 率 。 其 中 X 轴 为 过 滤 范 围 。 针 


对 的 是 10% 攻 击 量 的 平均 攻击 。 右 图 是 PCA 聚 类 方法 和 UnRAP 的 精确 
E, X 轴 是 攻击 量 ， 攻 击 方法 是 平均 攻击 ， 过 滤 范 围 为 10% 


UnRAP 算法 [3] 用 了 聚 类 方法 来 区 分 攻击 用 户 。 这 个 算法 用 了 一 种 测量 值 瓦 ,， 这 种 
方法 被 证 明 在 识别 高 度 相关 的 基因 表达 数据 中 非常 有 效 。 在 攻击 检测 领域 ， 为 每 个 用 户 计 
算 五 ,， 是 用 户 评分 均值 的 均 方差 ， 物 品 均值 的 均 方差 ， 和 总 体 平 均值 。 

DS) ras =r; —r, +r)? 
H,@) = 天 一 一 一 一 一 一 一 

24r n) 

7x; 是 所 有 用 户 对 物品 i 的 评分 均值 ，r EAP u 对 所 有 物品 的 评分 均值 ，r 是 所 有 用 户 对 


所 有 物品 的 评分 均值 。 
数据 库 中 的 所 有 用 户 都 计算 了 互 。， 并 根据 这 个 值 做 排序 。 前 10 个 最 高 分 值 的 用 户 被 
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识别 为 潜在 的 攻击 用 户 ， 并 从 中 检测 出 目标 物品 。 目 标 物品 是 那 种 偏离 用 户 评分 均值 的 物 
品 。 下 一 步 则 将 滑动 窗口 沿 着 用 户 排序 列表 向 下 滑动 一 个 用 户 的 位 置 。 在 窗口 中 计算 目标 
物品 的 评分 偏差 的 和 ， 当 这 个 和 值 达 到 0 的 时 候 停止 。 在 这 个 迭代 的 过 程 中 都 存在 的 用 户 
则 成 为 候选 的 攻击 用 户 。 之 后 会 在 这 个 候选 列表 中 过 滤 掉 没有 给 目标 物品 评分 或 者 和 攻击 
用 户 相悖 的 用 户 。 在 图 25. 10 中 列 出 了 这 种 方法 在 过 滤 平均 攻击 的 情境 中 的 精确 度 结果 。 
并 且 和 PCA 组 策略 方法 进行 了 比较 。 作 者 提 到 这 种 方法 在 攻击 量 中 等 的 情况 下 效果 好 于 
其 他 方法 ， 其 他 方法 这 种 情况 下 效果 会 有 所 下 降 。 


25.5.4 检测 结果 


无 论 是 有 监督 还 是 无 监督 的 检测 方法 ， 在 处 理 25.3 节 中 的 所 有 攻击 方面 都 达到 了 理 
想 的 结果 。 这 些 结果 是 毫 无 疑问 的 ， 因 为 实验 中 的 攻击 都 是 精确 设计 过 的 ， 表 现 得 相当 规 
则 ， 所 以 会 和 现实 用 户 有 差异 。 但 是 对 现实 中 的 攻击 的 处 理 效果 却 不 得 而 知 ， 因 为 一 般 网 
络 公 司 都 不 愿意 把 自己 的 系统 弱点 给 暴露 出 来 。 

回 看 图 25. 1 中 的 框架 图 ， 以 上 的 方法 应 该 会 对 图 中 左上 角 的 阴影 处 的 可 检测 区 域 处 
理 效果 很 好 。 对 于 善于 攻击 常用 基于 内 存 的 算法 的 攻击 方法 也 能 被 检测 出 来 。 现 在 依然 遗 
留 了 一 个 问题 ， 就 是 检测 范围 向 下 和 向 右 发 展 进 入 那些 不 是 最 好 的 攻击 方法 的 范围 ， 但 是 
这 些 攻击 方法 也 可 以 为 攻击 者 带 来 一 定 的 利益 。 


25.6 健壮 的 推荐 算法 


相 比 于 过 滤 和 检测 攻击 ， 另 一 个 方法 是 发 掘 对 于 攻击 有 健壮 性 的 推荐 算法 。 迄 今 为 
止 ， 研 究 者 已 经 提出 了 许多 具有 健壮 性 的 推荐 算法 ， 这 些 算法 主要 是 针对 那些 善于 攻击 基 
于 内 存 的 推荐 算法 的 攻击 。 现 有 的 一 个 未 解决 的 问题 是 ， 新 的 攻击 会 专门 挖掘 这 些 健壮 性 
好 的 推荐 算法 的 弱点 ， 这 些 推荐 算法 只 是 对 于 标准 攻击 有 防范 能 力 。 


25.6.1 基于 模型 的 推荐 


在 文献 L21] 中 描述 了 几 种 基于 模型 的 推荐 算法 ， 这 些 算法 针对 那些 高 效 攻击 非常 有 
效 。 而 且 这 些 算法 并 没有 牺牲 很 多 推荐 准确 率 来 提高 健壮 性 。 后 续 在 文献 [17，15] 中 对 基 
于 模型 的 算法 进行 了 综述 ， 并 提出 了 一 种 健壮 的 矩阵 分 解 策略 。 

在 文献 [21] 中 提出 了 基于 用 户 信息 聚 类 的 基于 模型 的 推荐 算法 。 在 这 个 算法 中 ， 相 
同 的 用 户 信息 被 聚 类 为 一 组 ， 之 后 再 计算 目标 用 户 和 用 户 组 的 相似 性 。 对 聚 类 后 的 每 个 
组 计算 每 个 物品 的 评分 均值 ， 得 到 一 个 组 级 用 户 信息 ， 之 后 利用 组 级 用 户 信息 来 预测 用 
户 对 其 他 物品 的 评分 值 。 当 用 户 w 和 一 个 用 户 组 非常 相似 ， 那 么 可 以 利用 这 个 组 级 用 户 
信息 对 i 的 评分 值 来 预测 u 对 i 评分 。 一 般 会 选择 个 最 相似 的 组 级 用 户 单元 的 评分 值 
来 预测 i 的 评分 值 ， 而 不 是 用 近邻 方法 。 在 25. 5. 3. 2 节 中 描述 了 k-means 聚 类 方法 和 
PLSA-based 聚 类 方法 ， 此 处 对 这 两 种 方法 进行 评估 。 对 比 kNN BH, A 25. 11 左 图 中 
展现 了 在 平均 攻击 后 的 评分 预测 偏 移 值 变化 曲线 。 根 据 文献 [21] 中 的 描述 ， 基 于 模型 的 
算法 被 认为 是 相当 健壮 的 算法 ， 并 且 不 会 很 明显 地 损失 精确 度 。 该 文献 中 针对 PLSA 和 
k-means 聚 类 方法 ， 用 了 30 组 级 用 户 信 息 ， 计 算 MAE 值 分 别 为 0.75 和 0.76，KkNN 算 
法 的 MAE 值 是 0.74。 
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图 25. 11 段 推荐 在 平均 攻击 量 为 5% 时 预测 变化 和 攻击 量 的 比较 ( 左 图 )。 在 攻击 量 
为 10% 使 用 RMF 情况 下 被 攻击 物品 的 MAE 和 攻击 的 变化 比较 ( 右 图 ) 


25.6.2 健壮 的 矩阵 分 解 算法 


有 一 种 基于 模型 的 推荐 算法 被 证 明 非 常 有 效 ， 这 种 方法 是 一 种 矩阵 分 解 算 法 ， 利 用 了 
奇异 值 分 解 方法 (SVD) 以 及 其 变 体 。 在 文献 L15，18] 提 出 了 一 种 和 聚 类 方法 连用 的 矩阵 分 
解 方法 ， 聚 类 方法 在 25. 5. 3. 2 节 中 提 到 了 ， 并 被 用 在 了 分 解 的 训练 阶段 。 像 PLSA RK 
方法 和 PLSA 推荐 方法 可 以 联 用 。 在 文献 [15] 中 提 到 ， 在 过 滤 掉 攻击 用 户 组 之 后 ， 留 下 来 
的 用 户 组 的 Pr(z;|x) 分 布 数据 应 该 重新 归 一 化 ， 最 后 的 几 个 训练 步骤 应 该 重新 计算 ， 进 而 
能 保留 PLSA 算法 的 评分 预测 精确 度 ， 并 能 显著 减少 评分 预测 偏 移 值 。 

在 文献 [18] 中 提 到 另外 一 个 方法 ， 利 用 了 推广 的 赫 布 型 学 习 算 法 (Generalized Hebbi- 
an Learning) 来 计算 rank-1 SVD 和 矩阵 分 解 : 

R~GH 
R WARE, GAH 是 rankl 和 矩阵。 这 个 算法 被 改进 使 得 可 疑 用 户 对 于 评分 预测 模型 的 
贡献 值 为 0。 在 图 25.11 的 右 图 中 展现 了 实验 结果 。 图 中 展示 了 攻击 算法 的 MAE 值 。 其 
中 可 疑 用 户 的 数量 和 注入 的 攻击 用 户 量 设置 成 一 样 ， 量 大 概 为 所 有 用 户 的 7%。 其 中 对 比 
了 kNN 算法 和 标准 SVD 算法 的 MAE 值 ， 还 有 对 比 是 否 存 在 攻击 用 户 的 情况 。 

有 一 些 支持 基于 模型 的 算法 具有 健壮 性 的 理论 结论 。 在 文献 L[35] 中 提出 了 一 种 具有 操 
控 性 的 协同 过 滤 算 法 并 证 明了 这 种 方法 的 健壮 性 。 方 法 中 攻击 对 于 单个 终端 用 户 的 评分 值 
数据 影响 减少 了 ， 同 时 增加 了 用 户 评分 过 的 物品 个 数 。 此 处 的 算法 效果 是 根据 攻击 后 的 评 
分 失真 程度 来 评估 的 。 以 上 的 算法 属于 基于 线性 概率 的 协同 过 滤 方 法 。 本 质 上 ， 系 统 模型 
的 输出 是 评分 分 布 的 概率 质量 函数 (PMF) 。 在 线性 算法 中 ， 被 攻击 的 推荐 系统 的 PMF fü 
是 以 下 两 种 情况 的 加 权 求 和 ， 一 种 是 单纯 考虑 真实 用 户 ， 另 一 种 是 单纯 考虑 攻击 用 户 。 当 
更 多 真实 用 户 提供 了 评分 数据 ， 基 于 真实 用 户 的 PMF 值 就 在 整体 的 PMEF 值 中 占 主 要 作 
用 ,健壮 性 就 得 到 了 保证 。 文 中 作者 描述 到 ， 尽 管 在 这 种 情况 下 最 近邻 算法 不 是 线性 的 ， 
但 一 些 知 名 的 基于 模型 的 算法 是 渐进 线性 的 ， 如 朴素 贝 叶 斯 算法 。 


25.6(3 其 他 具有 健壮 性 的 推荐 算法 


攻击 用 户 如 果 没 在 真实 用 户 的 近邻 那 就 不 能 起 到 攻击 效果 。 避 免 利 用 近邻 选择 规则 计 
算 相似 性 ， 那 么 那些 和 真实 用 户 很 相似 的 攻击 用 户 就 不 能 起 到 攻击 效果 ， 推 荐 算法 的 健壮 
性 就 能 得 到 保证 。 文 献 L[23] 中 描述 近邻 选择 是 去 选择 相近 的 并 且 最 有 用 的 用 户 信息 来 预测 
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评分 。 相 似 性 只 是 可 用 性 的 其 中 一 种 评估 方法 ， 这 种 近邻 规则 可 以 利用 其 他 评估 方法 来 扩 
充 。 其 中 一 种 选择 规则 是 反 流 行 度 。 利 用 这 种 规则 ， 推 荐 系统 的 推荐 效果 (利用 MAE 评 
估 ) 能 够 得 到 保证 。 同 时 也 能 有 效 地 压制 那些 基于 热门 物品 的 攻击 用 户 所 产生 的 攻击 影响 。 

文献 [31] 中 提出 了 一 种 具有 健壮 性 的 推荐 算法 ， 它 基于 关联 规则 挖掘 算法 。 算 法 中 把 
每 个 用 户 信 息 都 当 一 个 事务 ， 并 利用 关联 规则 把 相近 的 物品 关联 起 来 。 定 义 物品 集 XCI, 
用 户 信息 集合 中 的 一 部 分 包含 了 这 个 物品 集 。 关 联 规则 定义 为 X-Y(G a), HP o 是 
X UY, a, 是 规则 的 置信 度 ， 定 义 为 cCXUY)/VcCX)。 给 用 户 v 推荐 一 个 物品 会 搜索 基于 
关联 规则 的 最 高 置信 度 的 物品 。 其 中 X CLP, 是 用 户 信息 子 集 ，Y 包含 一 些 没有 被 u 评分 
的 物品 i。 对 于 特定 的 物品 没有 足够 的 支持 ， 物 品 就 不 会 出 现在 评分 频繁 的 物品 集中 ， 并 
且 不 会 被 推荐 出 来 。 这 种 算法 对 于 平均 攻击 有 效 。 在 攻击 量 是 15%% 的 时 候 ， 只 有 0.1% 的 
用 户 被 推荐 过 攻击 物品 。 以 上 效果 是 基于 关联 规则 算法 。 但 是 kNN 算法 却 有 80% — 
100%% 的 用 户 被 推荐 了 攻击 物品 。 但 是 作为 交换 ， 关 联 规 则 算法 的 覆盖 率 低 于 kNN 算法 。 
并 且 这 个 算法 对 于 分 段 攻 击 并 不 是 健壮 的 。 


25.6.4 影响 力 限 制 器 和 基于 信誉 的 推荐 


在 文献 [28，19] 中 提出 了 一 种 推荐 算法 ， 其 中 健壮 性 的 边界 可 以 被 计算 出 来 。 算 法 引 
入 了 两 种 额外 的 特性 ， 一 种 是 影响 力 限制 器 (influence limiter)， 一 种 是 信誉 系统 。 算 法 的 
思想 是 为 每 个 用 户 设 定 一 个 权重 ， 即 一 种 基于 全 局 的 信誉 值 。 如 果 一 个 用 户 为 一 个 近邻 用 
户 提供 了 正确 的 评分 ， 那 么 这 个 用 户 的 信誉 值 提升 ， 否 则 下 降 。 在 这 个 推荐 模型 中 ， 作 者 
提供 了 一 些 真 实 结果 ， 对 于 任何 达到 ”个 攻击 用 户 的 攻击 策略 ， 攻 击 者 所 带 来 的 负面 影响 
都 被 一 定 程度 限制 了 。 某 个 用 户 如 果 想 最 大 化 影响 力 都 会 受 限 于 信誉 系统 。 这 个 算法 的 其 
他 属性 ， 如 精确 度 ， 还 在 研究 中 。 

影响 力 限制 器 是 一 种 利用 信誉 度 的 推荐 算法 ( 见 第 20 章 )。 近 些 年 ， 不断 有 将 信任 模 
型 加 入 推荐 的 研究 出 现 L14，22，9]j。 在 文献 L14] 中 信誉 值 用 来 在 保持 现 有 精确 度 的 前 提 
下 增加 推荐 系统 的 覆盖 率 。 在 文献 L[22] 中 作者 描述 : 推荐 系统 中 应 该 考虑 带 来 精确 推荐 的 
用 户 信 息 。 文 献 L[9] 中 提出 了 另外 一 个 算法 中 利用 信誉 值 来 过 滤 用 户 信息 ， 只 是 用 信誉 值 
高 的 前 & 个 用 户 信息 来 预测 评分 。 信 人 誉 值 是 基于 用 户 对 一 个 物品 的 是 否 正确 评分 来 计算 
的 。 这 个 算法 的 健壮 性 对 于 攻击 者 获取 信誉 值 的 困难 程度 。 


25.7 总 结 


协同 推荐 系统 是 可 调节 的 ， 因 为 当 用 户 将 他 们 的 行为 数据 加 入 系统 中 时 ， 系 统 给 出 的 
推荐 结果 也 会 相应 改变 。 在 面 对 异 常情 况 和 错误 情况 时 ， 这 个 领域 内 的 健壮 性 有 别 于 一 般 
经 典 计 算 机 科学 。 我 们 的 目标 是 要 保持 系统 可 调节 ， 而 不 是 让 攻击 者 无 可 攻击 。 攻 击 者 希 
望 能 够 左右 具有 健壮 性 的 系统 输出 ， 那 么 他 需要 使 得 他 的 系统 足够 精巧 ， 不 能 让 攻击 检测 
系统 检测 出 来 ， 设 计 的 用 户 信息 不 会 在 新 注册 的 用 户 群体 中 显得 异常 ， 并 且 需 要 和 现 有 真 
实用 户 的 分 布 模型 相 匹配 ， 以 至 于 降 维 方法 不 会 将 它们 分 离 出 来 。 如 果 以 上 这 些 都 难以 达 
到 ， 攻 击 的 收益 被 限制 了 ， 那么 攻击 者 就 找 不 到 与 他 的 努力 相对 应 的 攻击 效果 。 这 是 在 对 
抗 性 领域 内 所 期 望 达到 的 效果 。 

很 难说 现在 我 们 离 这 个 期 望 的 目标 多 近 。 攻 击 者 如 果 发 现 某 种 检测 策略 实行 了 ， 那 么 
也 会 改进 攻击 算法 来 避免 被 检测 出 来 。 例 如 ， 文 献 [23] 中 提 到 ， 如 果 攻 击 者 注意 到 某 个 规 
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则 被 用 来 决定 用 户 的 近邻 内 有 没有 攻击 用 户 ， 攻 击 者 会 把 攻击 用 户 调节 到 不 那么 有 效 ， 使 
得 它 不 被 检测 出 来 。 在 文献 [34] 中 研究 了 不 同 攻击 用 户 的 模糊 性 评估 方法 。 一 般 的 研究 发 
现 ， 模 糊 的 攻击 用 户 信息 相对 于 最 优 的 攻击 用 户 单元 所 带 来 的 攻击 效果 并 不 差 ， 并 且 更 加 
难 检 测 。 这 个 方向 需要 更 多 的 研究 。 

在 对 抗 攻击 的 系统 算法 中 提出 了 几 个 相近 的 方法 。 因 为 基于 模型 的 算法 比 基 于 内 存 的 
算法 有 更 高 的 健壮 性 ， eae a TRI Met oe R 文献 L31] 中 提出 了 针对 
分 段 攻击 的 关联 规则 方法 。 

我 们 可 以 从 另外 的 角度 来 看 这 个 问题 ， 如 推荐 系统 的 设计 者 和 攻击 者 是 处 在 相同 的 一 
个 游戏 中 。 设 计 者 设计 了 推荐 系统 ， 攻 击 者 设计 出 最 佳 的 攻击 算法 ， 然 后 设计 者 再 给 出 回 
应 修正 系统 ， 循 环 往复 。 我 们 想 看 到 的 结果 是 攻击 者 的 收益 越 来 越 低 ， 每 一 次 迭代 都 使 攻 
击 需要 更 多 的 代价 并 且 效果 更 差 。 带 有 检测 策略 的 系统 至 少 会 比 原始 系统 难以 攻击 ， 即 使 
在 最 差 的 情况 下 ， 即 没有 攻击 被 检测 出 来 。 至 今 还 没有 发 现 现 有 提出 的 健壮 性 推荐 算法 ， 
如 RMF， 具 有 明显 的 弱点 ， 以 至 于 容易 受到 一 些 精心 设计 的 攻击 。 
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州 大 学 - 吴 宾 
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翻译 : ARF, EAKA- TE 
审核 : SPUR. KEE, RE 


第 12 章 
翻译 : 谢 冰 莹 ， 余 亮 ， 郑 州 大 学 - 吴 宾 
审核 : 吉林 大 学 - 丁 彬 钊 ， 北 京 大 学 - 王 
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翻译 : 赵 华 飞 ， 卢 青峰 ， 郑 州 大 学 - 吴 宾 

审核 : 李 雪 ， 吉 林 大 学 - 丁 彬 钊 ， 胡 聪 ( 胡 
PE) 
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翻译 : 韶关 学 院 - 梁 永 霖 老师 ， 燕 山大 学 - 
王 孝 先 ， 郑 州 大 学 - 吴 宾 

WK: 刘 良 良 ， 左 其 盛 ， 谢 冰 莹 ， 吉 林 大 
学 - 丁 彬 钊 


第 15 章 
翻译 : 刘 子 微 ， 吉 林 大 学 - 丁 彬 钊 ， 李 雪 
审核 : 张彤 彤 ， 郑 州 大 学 - 吴 宾 
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Mit: 何 伟 岗 ， 胡 聪 ( 胡 户主 ) 
审核 : 张 洋 ， 左 其 盛 


第 17 章 
翻译 : 何 佳 倍 ， 燕 山大 学 - 王 孝 先 
审核 : BA, WEP E) 


第 18 章 
翻译 : 黎 强 ， 何 佳 倍 
审核 : TA, BARS CHAE) 


第 19 章 
翻译 ， 邓 展 成 ， 佚 名 
HK, Ri, MRCP ED 
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翻译 : 重庆 工商 大 学 - 张 天 永 

审核 : 李 曙 光 ， 胡 聪 ( 胡 户主 )， 郑 州 大 学 - 
吴 宾 
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翻译 : 李 艳 民 ， 张 杰 ， 佚 名 
审核 : 北京 大 学 - 王 雪 丽 ， 郑 州 大 学 - 吴 宾 
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翻译 北京 大 学 - 王 雪 丽 ， 马 占 国 

审核 : 韶关 学 院 - 梁 永 霖 老师 ， 吉 林 大 学 - 
Tl 


第 23 章 
翻译 : 北京 大 学 - 王 雪 丽 
审核 : 刘 良 良 
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翻译 : 张 秀 伟 
审核 : 朱 亮 ， 李 青 ， 李 曙光 


第 25 章 
翻译 : 胡 聪 ( 胡 户 主 ) 
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畅销 书 (The Age of Spiritual Machines 》 作 者 又 一 力作 
《纽约 时 报 》 评 选 的 “2005 年 度 博 客 谈论 最 多 的 图 书 ” 之 一 
2005 年 CBS News 评 选 的 畅销 书 
2005 年 美国 最 畅销 非 小 说 类 图 书 
2005 年 亚马逊 最 佳 科学 图 书 
比尔 盖 获 、 比 尔 PPTA 
一 部 预测 人 工 智 能 和 科技 未 来 的 奇 书 





“阅读 本 书 ， 你 将 惊叹 于 人 类 发 展 进程 中 下 一 个 意义 深远 的 飞跃 ， 它 从 根本 上 改变 了 人 类 的 生活 、 工 作 

以 及 感知 世界 的 方式 。 库 兹 韦 尔 的 奇 点 是 一 个 壮举 ， 以 不 可 思议 的 想象 力 和 雄辩 论述 了 即将 发 生 的 颠覆 性 事 
件 ， 它 将 像 电 和 计算 机 一 样 从 根本 上 改变 我 们 的 观念 。” 

一 一 迪 安 . 卡门 ,物理 学 家 

“本 书 对 科技 发 展 持 乐观 的 态度 ， 值 得 阅读 并 引 人 深思 。 对 于 那些 像 我 这 样 对 “承诺 与 风险 的 平衡 ”这 

一 问题 的 看 法 与 库 兹 书 尔 不 同 的 人 来 说 ， 本 书 进一步 明确 了 需要 通过 对 话 的 方式 来 解决 由 于 科技 加 速 发 展 而 

引发 的 诸多 问题 。” 
一 一 比尔 - 乔 伊 ，SUN 公 司 创始 人 ， 前 首席 科学 家 


